Предлагаемые правки для FAQ треда (он же глоссарий для турбоимбецилов)

Инфу взял отсюда:
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
https://rentry.co/tohoaifaq
https://rentry.org/sdg-link

(+ добавил шизы от себя)


  1. Чем вы тут занимаетесь?
  2. Как поставить на ПК/Облако?
  3. Платиновые вопросы
    1. Нашёл несколько вариантов одной и той-же модели, какую выбрать?
      1. ckpt или safetensors
      2. fp16 или fp32
      3. full или pruned
    2. Ваши нейронки могут раздеть мою ЕОТ?
    3. Нейронка может сгенерировать картинки с %waifu_name%?
    4. Как активировать тёмный интерфейс?
    5. Как мне поставить генерацию картинок на ночь?
    6. Как восстановить последние использованные настройки после перезапуска автоматика?
    7. Что за (((скобочки))) ещё и [квадратные] с (циферками:0.42) в промптах?
    8. Как мне поменять максимальное значение ползунков в интерфейсе?
    9. Как мне вынести настройке VAE и Clip-skip в верхнюю часть интерфейса?
    10. Какую модель выбрать для вката?
    11. Почему у моей вайфу неправильное количество пальцев?
    12. Почему у моей вайфу фиолетовые синяки?
    13. Почему моя вайфу генерируется несколько раз на одной картинке?
    14. Сгенерировал чёрный квадрат
    15. Я сгенерировал хорошую картинку, но на ней есть косяк...
  4. Общая терминология
    1. Stable Diffusion
    2. NovelAI
    3. Автоматик / stable-diffusion-webui
    4. Модель
    5. VAE
    6. Эмбеддинги / Embeddings / Textural Inversion
    7. LoRA
    8. Гиперы / Hypernetworks
  5. Интерфейс автоматика
    1. Клип / Clip skip
    2. Промпт / Prompt
    3. Негатив / Negative Prompt
    4. Семплер / Sampling method
    5. Число шагов / Sampling steps
    6. Сид / Seed
    7. Variation seed
    8. Batch count & Batch size
    9. Цфг / CFG Scale
    10. Хайрез-фикс / Hires. fix
    11. Восстановление лиц / Restore faces
    12. Тайлинг
    13. Денойз / Denoising strength
    14. Апскейлер
  6. Основные режимы работы автоматика
    1. txt2img
    2. img2img
    3. Inpaint
    4. Extras
  7. Часто-используемые встроенные скрипты
    1. Грид / XYZ plot
    2. SD Upscale

Чем вы тут занимаетесь?

Генерируем картинки при помощи нейросетей.

Обрати внимание, что на доске /ai/ существует несколько профильных тредов по нейро-генерациям картинок. Самые живые из них это:

  • /nai/ - для аниме-тяночек
  • /sd/ - для уклона в реализм

Как поставить на ПК/Облако?

https://rentry.co/nai_install

Статья, на которую ссылаемся, довольно короткая. Возможно, имеет смысл перенести её в этот документ и убрать из шапки?

Платиновые вопросы

Нашёл несколько вариантов одной и той-же модели, какую выбрать?
ckpt или safetensors

.ckpt - это старый формат моделей. Кроме весов, он содержит исполняемый код на python, который может быть вредоносным.

.safetensors это более новый формат - он не хранит ничего, кроме весов модели. При наличии выбора из этих двух форматов всегда выбирай safetensors.

fp16 или fp32

Модели fp16 используют в два раза меньшее число бит для описания отдельных весов нейронки, что приводит к уменьшению веса модели в два раза. Иными словами, fp16 менее точные, но более легковесные и быстрее загружаются в видеопамять. Стоит отметить, что фактическую разницу получившихся картинок между fp16 и fp32 надо выискивать под лупой - влияние на качество должно быть в теории, на практике его не заметно.

full или pruned

В pruned версиях модели удалены избыточные связи внутри нейронки, что приводит к тому, что она занимает меньше места. В теории, это слегка ухудшает качество модели, на практике разница малозаметна.

Стоит отметить, что некоторые гайды по лорам советуют использовать именно full версии нейронок для обучения.

Ваши нейронки могут раздеть мою ЕОТ?

Да, при помощи Inpaint можно обработать существующую фотографию, а, обучив лору, ты сможешь генерировать любое количество контента с твоей ЕОТ.

Но с такими реквестами лучше в SD-тред.

Нейронка может сгенерировать картинки с %waifu_name%?

Зависит от того, насколько твоя вайфу популярна.

  1. Если это что-то популярное (например Аска или Мегумин), то просто используй теги персонажа с бур и получишь приемлемый результат
  2. Если результат не понравился, можешь попробовать найти готовую лору для твоей вайфу на https://civitai.com
  3. Если ничего не смог найти, то тогда остаётся только обучить собственную лору. Гайды по обучению закреплены в шапке треда
Как активировать тёмный интерфейс?

Добавь --theme dark в параметрах запуска батника.

Как мне поставить генерацию картинок на ночь?

Правая кнопка мыши на кнопку "Generate" -> "Generate forever".

Как восстановить последние использованные настройки после перезапуска автоматика?

1. Используй синюю кнопку со стрелкой, которая находится под кнопкой генерации

2. Либо используй плагин stable-diffusion-webui-state

Поставть плагин, перезапусти автоматик, перейди в Settings -> State и там выбери, какие из настроек ты хочешь сохранять после перезапуска.

Что за (((скобочки))) ещё и [квадратные] с (циферками:0.42) в промптах?

Использование () увеличивает силу заключённых внутрь тегов, а [] уменьшает её. Без указания скобок сила всех тегов равно 1. Скобочки можно вкладывать друг-в-друга.

(тег) - увеличивает силу тега в 1.1 раз
((тег)) - увеличивает силу тега в 1.21 раз (= 1.1 * 1.1)
[тег] - уменьшает силу тега в 1.1 раз
(тег:1.5) - увеличивает силу тега в 1.5 раза
(тег:0.25) - уменьшает силу тега в 4 раза (= 1 / 0.25)
\(тег\) - экранирование скобок при помощи обратного слеша необходимо если скобки должны являться частью тега, например, при указании имени персонажа с указанием тайтла, в соответствии с его тегом на бурах. Делай так: rem \(re:zero\), не так rem (re:zero).

При использовании лор её вес можно указывать без взятия в дополнительные скобки: <lora:examplelora:0.4>

Тут должна быть картинка с демонстрацией разных весов тега, но мне пока влом искать/сгенерить что-то подходящее.

Как мне поменять максимальное значение ползунков в интерфейсе?

Множество настроек, связанных со значениями по умолчанию и с предельными значениями устанавливаются в файле ui-config.json, который находится в корневой директории автоматика.

К примеру, изменив выделенную строку на изображении ниже, ты можешь изменить максимально-доступную ширину картинки в режиме txt2img.

Как мне вынести настройке VAE и Clip-skip в верхнюю часть интерфейса?

Открой "Settings -> User interface" и выстави в поле "Quicksettings list" следующую строку: sd_model_checkpoint,sd_vae,CLIP_stop_at_last_layers

Какую модель выбрать для вката?

https://rentry.org/nai_models

Почему у моей вайфу неправильное количество пальцев?

Это общая проблема для всех актуальных аниме-моделей. Либо используй читы в виде какого-нибудь из тегов рода:

  • arms behind head
  • arms behind back
  • arms between legs
  • arms in pockets

Либо читай варианты решения здесь.

Почему у моей вайфу фиолетовые синяки?

У вас не подключено VAE. Как чинить читай тут.

Почему моя вайфу генерируется несколько раз на одной картинке?
  1. Используй теги 1girl, solo
  2. Уменьши стартовый размер картинки и увеличивай её при помощи hires.fix. Стартовые изображения, размером сильно большим чем 512x512, имеют тенденцию к генерации многоруких мутантов и множества персонажей
  3. Уменьши denoising strength если ты используешь hires. fix
Сгенерировал чёрный квадрат

Пропиши в параметрах webui-user.bat аргумент set COMMANDLINE_ARGS= --no-half-vae. Для карт 16 линейки можно --precision full --no-half.

Я сгенерировал хорошую картинку, но на ней есть косяк...

Есть несколько вариантов:
Используй Inpaint.
Используй Variation seed.

Надо либо добавить конкретику, либо перекрёстные ссылки на связанные статьи.

Другой вариант:
Оставьте промпт без изменений, но поиграйте с весами некоторых тегов, например, уменьшите blue hair до (blue hair: 0.6). Либо же поменяйте порядок тегов в промпте, поскольку изменение порядка повлияет на итоговый результат.

Общая терминология

Stable Diffusion

TODO

NovelAI

TODO

Автоматик / stable-diffusion-webui

Автоматик, каломатик, поломатик, webui - бразуерный интерфейс для Stable Diffusion:
https://github.com/AUTOMATIC1111/stable-diffusion-webui

Так-же, автоматиком иногда называют самого автора данной системы, он же voldy.

Существует несколько форков данного варианта интерфейса к моделям на базе SD, но, в настоящий момент, именно этот интерфейс используют подавляющей число людей, генерирующих нейро-картинки.

Так же стоит упомянуть о проекте альтернативного node-based интерфейса ComfyUI. У него гораздо-меньшее количество пользователей, но он позволяет автоматизировать многие вещи, которые на автоматике приходится делать вручную.

Для ньюфага настоятельно рекомендуется использовать именно Автоматик, поскольку все основные проблемы для него давно известны и будет больше шансов, что кто-нибудь сможет помочь с вашими проблемами в треде.

Модель

Уже расписано.

VAE

Уже расписано.

Эмбеддинги / Embeddings / Textural Inversion

Уже расписано.

LoRA

Уже расписано

Гиперы / Hypernetworks

TODO

Интерфейс автоматика

Клип / Clip skip

Уже расписано.

Промпт / Prompt

TODO

Негатив / Negative Prompt

TODO

Семплер / Sampling method

TODO

Число шагов / Sampling steps

TODO

Сид / Seed

TODO

Variation seed

TODO

Batch count & Batch size

Batch size - сколько картинок будет генерироваться одновременно
Batch count - сколько картинок будет генерироваться последовательно

TODO

Цфг / CFG Scale

Хайрез-фикс / Hires. fix

Восстановление лиц / Restore faces

TODO

Тайлинг

TODO

Денойз / Denoising strength

Больше - будет сильнее отличаться.
Меньше - будет отличаться меньше.
Заметные изменения начинаются с 0.5, на 0.7 сильные вариации, на 0.9 другая картинка.
TODO

Апскейлер

TODO

Основные режимы работы автоматика

txt2img

TODO

img2img

TODO

Inpaint

TODO

Extras

TODO

Часто-используемые встроенные скрипты

Грид / XYZ plot

TODO
You can select the X/Y/Z plot script on the very bottom left of your WebUI - this brings up some fields.
You need to set the axes type to whatever you want to compare - then input the proper values in the corresponding box on the right.
These boxes support ranges:
1-5 = 1, 2, 3, 4, 5

Specifying the increment or decrement:
1-3 (+0.5) = 1, 1.5, 2, 2.5, 3

Specifying the count:
1-10 [5] = 1, 3, 5, 7, 10

Prompt S/R

This option is unique in that it does search and replace in your prompt - meaning the first value you input must be the one the script will try to find.
As an example if you'd like different animals in your
A girl looking at a very handsome cat wearing a suit
prompt, you'd put cat, dog, polar bear in your S/R box.

If you'd like to specify more than one tag and for example change
2girls, kissing, blushing to them hugging and smiling
you'll have to put those tags in quotes and make sure there are no spaces between the quotes and the commas separating them!
So in this case, your S/R box becomes
"kissing, blushing","hugging, smiling"

SD Upscale

Предоставляет функционал апскейла изображения посредством разбиения его на отдельные кусочки (тайтлы) и масшабированием их по отдельности, чтобы обойти ограничения по лимиту видеопамяти. Позволяет создавать изображения любого размера.

В шапке треда закреплено несколько гайдов по работе с данным скриптом.

Для примера - одним из анонов при помощи этого скрипта была создана картинка Гига-Сырны размером 24576 х 18432 (450 мегапикселов):

(оригинал утерян, есть только сжатая версия)

Кроп 1500х1125 из неё:

Edit Report
Pub: 16 Apr 2023 16:04 UTC
Edit: 21 Apr 2023 19:04 UTC
Views: 386