Подборка мокрых писек, чтобы делать небольшие датасеты на 50-1000 пикч
https://github.com/JingyunLiang/SwinIR
Апскейл. Отлично подходит для 2D-иллюстраций и CG, умеренно хорошо - для фоток. Онлайн демка https://replicate.ai/jingyunliang/swinir
https://github.com/SkyTNT/anime-segmentation/
Убрать фон в пикчах, что иногда улучшает качество трейнинга. Онлайн демка https://huggingface.co/spaces/xm012/anime-remove-background
FastStone photo resizer: прога для винды, чтобы массово применять различные операции к пикчам: кроп, ресайз, переименование, подкрутить или ослабить яркость/контрастность. Гибкая настройка. Подходит чтобы делать квадратные пикчи одинакового размера. Можно добавить белые поля, а можно обрезать изображения чтобы вписались в квадрат по центру (или по верхнему краю, например).
Awesome dublicate photo finder: прога для винды, чтобы находить повторяющиеся пикчи, сортировать по уровню схожести, отображать пары и выбирать вручную, какой вариант оставить. Подойдет для небольших сетов.
Duplicate cleaner pro: подойдет даже для огромных сетов размером в десятки гигабайт, мощный инструмент для винды.
https://github.com/Bionus/imgbrd-grabber
Закачка пикч с Danbooru по нужным тегам. Можно помещать теги в названия файлов и по ним сделать подписи.
https://github.com/ostrolucky/Bulk-Bing-Image-downloader
Массовая закачка пикч. Можно скормить ей текстовый файл с поисковыми запросами.
PhotoFiltre: редактор для винды, позволяет открыв пикчу сразу же выделить ее фрагмент одним движением мыши, и тут же сохранить пикчу как этот кроп. Всего пара секунд и два-три клика. Удобно для ручного кропа небольших сетов. Квадратное выделение также возможно.
Clip captioning: различные реализации на основе "машинного зрения", чтобы массово генерировать подписи к любому количеству пикч и сохранять их в том же порядке в текстовый файл (который затем можно разбить по строкам на кучу файлов в той же нумерации). Был удобный ноутбук для колаба/kaggle, но проебался, найдете замену сами.