Подборка мокрых писек, чтобы делать небольшие датасеты на 50-1000 пикч

https://github.com/JingyunLiang/SwinIR
Апскейл. Отлично подходит для 2D-иллюстраций и CG, умеренно хорошо - для фоток. Онлайн демка https://replicate.ai/jingyunliang/swinir

https://github.com/SkyTNT/anime-segmentation/
Убрать фон в пикчах, что иногда улучшает качество трейнинга. Онлайн демка https://huggingface.co/spaces/xm012/anime-remove-background

FastStone photo resizer: прога для винды, чтобы массово применять различные операции к пикчам: кроп, ресайз, переименование, подкрутить или ослабить яркость/контрастность. Гибкая настройка. Подходит чтобы делать квадратные пикчи одинакового размера. Можно добавить белые поля, а можно обрезать изображения чтобы вписались в квадрат по центру (или по верхнему краю, например).

Awesome dublicate photo finder: прога для винды, чтобы находить повторяющиеся пикчи, сортировать по уровню схожести, отображать пары и выбирать вручную, какой вариант оставить. Подойдет для небольших сетов.

Duplicate cleaner pro: подойдет даже для огромных сетов размером в десятки гигабайт, мощный инструмент для винды.

https://github.com/Bionus/imgbrd-grabber
Закачка пикч с Danbooru по нужным тегам. Можно помещать теги в названия файлов и по ним сделать подписи.

https://github.com/ostrolucky/Bulk-Bing-Image-downloader
Массовая закачка пикч. Можно скормить ей текстовый файл с поисковыми запросами.

PhotoFiltre: редактор для винды, позволяет открыв пикчу сразу же выделить ее фрагмент одним движением мыши, и тут же сохранить пикчу как этот кроп. Всего пара секунд и два-три клика. Удобно для ручного кропа небольших сетов. Квадратное выделение также возможно.

Clip captioning: различные реализации на основе "машинного зрения", чтобы массово генерировать подписи к любому количеству пикч и сохранять их в том же порядке в текстовый файл (который затем можно разбить по строкам на кучу файлов в той же нумерации). Был удобный ноутбук для колаба/kaggle, но проебался, найдете замену сами.

Edit
Pub: 22 Jan 2023 20:26 UTC
Views: 2512