Предлагаемые правки для FAQ треда (он же глоссарий для турбоимбецилов)
Инфу взял отсюда:
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
https://rentry.co/tohoaifaq
https://rentry.org/sdg-link
(+ добавил шизы от себя)
- Чем вы тут занимаетесь?
- Как поставить на ПК/Облако?
- Платиновые вопросы
- Нашёл несколько вариантов одной и той-же модели, какую выбрать?
- Ваши нейронки могут раздеть мою ЕОТ?
- Нейронка может сгенерировать картинки с %waifu_name%?
- Как активировать тёмный интерфейс?
- Как мне поставить генерацию картинок на ночь?
- Как восстановить последние использованные настройки после перезапуска автоматика?
- Что за (((скобочки))) ещё и [квадратные] с (циферками:0.42) в промптах?
- Как мне поменять максимальное значение ползунков в интерфейсе?
- Как мне вынести настройке VAE и Clip-skip в верхнюю часть интерфейса?
- Какую модель выбрать для вката?
- Почему у моей вайфу неправильное количество пальцев?
- Почему у моей вайфу фиолетовые синяки?
- Почему моя вайфу генерируется несколько раз на одной картинке?
- Сгенерировал чёрный квадрат
- Я сгенерировал хорошую картинку, но на ней есть косяк...
- Общая терминология
- Интерфейс автоматика
- Основные режимы работы автоматика
- Часто-используемые встроенные скрипты
Чем вы тут занимаетесь?
Генерируем картинки при помощи нейросетей.
Обрати внимание, что на доске /ai/ существует несколько профильных тредов по нейро-генерациям картинок. Самые живые из них это:
- /nai/ - для аниме-тяночек
- /sd/ - для уклона в реализм
Как поставить на ПК/Облако?
Статья, на которую ссылаемся, довольно короткая. Возможно, имеет смысл перенести её в этот документ и убрать из шапки?
Платиновые вопросы
Нашёл несколько вариантов одной и той-же модели, какую выбрать?
ckpt или safetensors
.ckpt
- это старый формат моделей. Кроме весов, он содержит исполняемый код на python, который может быть вредоносным.
.safetensors
это более новый формат - он не хранит ничего, кроме весов модели. При наличии выбора из этих двух форматов всегда выбирай safetensors
.
fp16 или fp32
Модели fp16 используют в два раза меньшее число бит для описания отдельных весов нейронки, что приводит к уменьшению веса модели в два раза. Иными словами, fp16 менее точные, но более легковесные и быстрее загружаются в видеопамять. Стоит отметить, что фактическую разницу получившихся картинок между fp16 и fp32 надо выискивать под лупой - влияние на качество должно быть в теории, на практике его не заметно.
full или pruned
В pruned версиях модели удалены избыточные связи внутри нейронки, что приводит к тому, что она занимает меньше места. В теории, это слегка ухудшает качество модели, на практике разница малозаметна.
Стоит отметить, что некоторые гайды по лорам советуют использовать именно full версии нейронок для обучения.
Ваши нейронки могут раздеть мою ЕОТ?
Да, при помощи Inpaint можно обработать существующую фотографию, а, обучив лору, ты сможешь генерировать любое количество контента с твоей ЕОТ.
Но с такими реквестами лучше в SD-тред.
Нейронка может сгенерировать картинки с %waifu_name%?
Зависит от того, насколько твоя вайфу популярна.
- Если это что-то популярное (например Аска или Мегумин), то просто используй теги персонажа с бур и получишь приемлемый результат
- Если результат не понравился, можешь попробовать найти готовую лору для твоей вайфу на https://civitai.com
- Если ничего не смог найти, то тогда остаётся только обучить собственную лору. Гайды по обучению закреплены в шапке треда
Как активировать тёмный интерфейс?
Добавь --theme dark
в параметрах запуска батника.
Как мне поставить генерацию картинок на ночь?
Правая кнопка мыши на кнопку "Generate" -> "Generate forever".
Как восстановить последние использованные настройки после перезапуска автоматика?
1. Используй синюю кнопку со стрелкой, которая находится под кнопкой генерации
2. Либо используй плагин stable-diffusion-webui-state
Поставть плагин, перезапусти автоматик, перейди в Settings -> State и там выбери, какие из настроек ты хочешь сохранять после перезапуска.
Что за (((скобочки))) ещё и [квадратные] с (циферками:0.42) в промптах?
Использование ()
увеличивает силу заключённых внутрь тегов, а []
уменьшает её. Без указания скобок сила всех тегов равно 1. Скобочки можно вкладывать друг-в-друга.
(тег)
- увеличивает силу тега в 1.1 раз
((тег))
- увеличивает силу тега в 1.21 раз (= 1.1 * 1.1)
[тег]
- уменьшает силу тега в 1.1 раз
(тег:1.5)
- увеличивает силу тега в 1.5 раза
(тег:0.25)
- уменьшает силу тега в 4 раза (= 1 / 0.25)
\(тег\)
- экранирование скобок при помощи обратного слеша необходимо если скобки должны являться частью тега, например, при указании имени персонажа с указанием тайтла, в соответствии с его тегом на бурах. Делай так: rem \(re:zero\)
, не так .rem (re:zero)
При использовании лор её вес можно указывать без взятия в дополнительные скобки: <lora:examplelora:0.4>
Тут должна быть картинка с демонстрацией разных весов тега, но мне пока влом искать/сгенерить что-то подходящее.
Как мне поменять максимальное значение ползунков в интерфейсе?
Множество настроек, связанных со значениями по умолчанию и с предельными значениями устанавливаются в файле ui-config.json
, который находится в корневой директории автоматика.
К примеру, изменив выделенную строку на изображении ниже, ты можешь изменить максимально-доступную ширину картинки в режиме txt2img.
Как мне вынести настройке VAE и Clip-skip в верхнюю часть интерфейса?
Открой "Settings -> User interface" и выстави в поле "Quicksettings list" следующую строку: sd_model_checkpoint,sd_vae,CLIP_stop_at_last_layers
Какую модель выбрать для вката?
Почему у моей вайфу неправильное количество пальцев?
Это общая проблема для всех актуальных аниме-моделей. Либо используй читы в виде какого-нибудь из тегов рода:
arms behind head
arms behind back
arms between legs
arms in pockets
Либо читай варианты решения здесь.
Почему у моей вайфу фиолетовые синяки?
У вас не подключено VAE. Как чинить читай тут.
Почему моя вайфу генерируется несколько раз на одной картинке?
- Используй теги
1girl, solo
- Уменьши стартовый размер картинки и увеличивай её при помощи hires.fix. Стартовые изображения, размером сильно большим чем 512x512, имеют тенденцию к генерации многоруких мутантов и множества персонажей
- Уменьши denoising strength если ты используешь hires. fix
Сгенерировал чёрный квадрат
Пропиши в параметрах webui-user.bat
аргумент set COMMANDLINE_ARGS= --no-half-vae
. Для карт 16 линейки можно --precision full --no-half
.
Я сгенерировал хорошую картинку, но на ней есть косяк...
Есть несколько вариантов:
Используй Inpaint.
Используй Variation seed.
Надо либо добавить конкретику, либо перекрёстные ссылки на связанные статьи.
Другой вариант:
Оставьте промпт без изменений, но поиграйте с весами некоторых тегов, например, уменьшите blue hair
до (blue hair: 0.6)
. Либо же поменяйте порядок тегов в промпте, поскольку изменение порядка повлияет на итоговый результат.
Общая терминология
Stable Diffusion
TODO
NovelAI
TODO
Автоматик / stable-diffusion-webui
Автоматик, каломатик, поломатик, webui - бразуерный интерфейс для Stable Diffusion:
https://github.com/AUTOMATIC1111/stable-diffusion-webui
Так-же, автоматиком иногда называют самого автора данной системы, он же voldy.
Существует несколько форков данного варианта интерфейса к моделям на базе SD, но, в настоящий момент, именно этот интерфейс используют подавляющей число людей, генерирующих нейро-картинки.
Так же стоит упомянуть о проекте альтернативного node-based интерфейса ComfyUI. У него гораздо-меньшее количество пользователей, но он позволяет автоматизировать многие вещи, которые на автоматике приходится делать вручную.
Для ньюфага настоятельно рекомендуется использовать именно Автоматик, поскольку все основные проблемы для него давно известны и будет больше шансов, что кто-нибудь сможет помочь с вашими проблемами в треде.
Модель
Уже расписано.
VAE
Уже расписано.
Эмбеддинги / Embeddings / Textural Inversion
Уже расписано.
LoRA
Уже расписано
Гиперы / Hypernetworks
TODO
Интерфейс автоматика
Клип / Clip skip
Уже расписано.
Промпт / Prompt
TODO
Негатив / Negative Prompt
TODO
Семплер / Sampling method
TODO
Число шагов / Sampling steps
TODO
Сид / Seed
TODO
Variation seed
TODO
Batch count & Batch size
Batch size - сколько картинок будет генерироваться одновременно
Batch count - сколько картинок будет генерироваться последовательно
TODO
Цфг / CFG Scale
Хайрез-фикс / Hires. fix
Восстановление лиц / Restore faces
TODO
Тайлинг
TODO
Денойз / Denoising strength
Больше - будет сильнее отличаться.
Меньше - будет отличаться меньше.
Заметные изменения начинаются с 0.5, на 0.7 сильные вариации, на 0.9 другая картинка.
TODO
Апскейлер
TODO
Основные режимы работы автоматика
txt2img
TODO
img2img
TODO
Inpaint
TODO
Extras
TODO
Часто-используемые встроенные скрипты
Грид / XYZ plot
TODO
You can select the X/Y/Z plot script on the very bottom left of your WebUI - this brings up some fields.
You need to set the axes type to whatever you want to compare - then input the proper values in the corresponding box on the right.
These boxes support ranges:
1-5 = 1, 2, 3, 4, 5
Specifying the increment or decrement:
1-3 (+0.5) = 1, 1.5, 2, 2.5, 3
Specifying the count:
1-10 [5] = 1, 3, 5, 7, 10
Prompt S/R
This option is unique in that it does search and replace in your prompt - meaning the first value you input must be the one the script will try to find.
As an example if you'd like different animals in your
A girl looking at a very handsome cat wearing a suit
prompt, you'd put cat, dog, polar bear in your S/R box.
If you'd like to specify more than one tag and for example change
2girls, kissing, blushing to them hugging and smiling
you'll have to put those tags in quotes and make sure there are no spaces between the quotes and the commas separating them!
So in this case, your S/R box becomes
"kissing, blushing","hugging, smiling"
SD Upscale
Предоставляет функционал апскейла изображения посредством разбиения его на отдельные кусочки (тайтлы) и масшабированием их по отдельности, чтобы обойти ограничения по лимиту видеопамяти. Позволяет создавать изображения любого размера.
В шапке треда закреплено несколько гайдов по работе с данным скриптом.
Для примера - одним из анонов при помощи этого скрипта была создана картинка Гига-Сырны размером 24576 х 18432 (450 мегапикселов):
(оригинал утерян, есть только сжатая версия)
Кроп 1500х1125 из неё: