Теперь моя очередь баловаться с поняшными нейросетями.

+58
Xodokв блоге Я нейрирую двумя хвостами29 июля 2025, 23:22
Заглянешь?



Вот и дотянулись мои копыта и хвост до нейросерей. Скачал себе нейросеть «Fooocus 2.5.5» и тут понеслось. А точнее понеслась всякая хрень. Не думал что так сложно будет сделать что-то дельное. Довольно сложно разобраться с настройками неиросети и созданием внятного запроса. В течении нескольких дней игрался с нейронкой и вот что получилось.

Твайлайт СпарклОдно из первых нормально получившихся изображений из первой полусотни проб. Нейронка даже свою подпись оставила у ног Твайли.
Портрет «Слышь, дружи, а то...»
Ушки на макушке
Идём на Понивильский бал


Рейнбоу ДешЗадорная пегаска
в спортивном костюме
летает в небесах


ФлаттершайОдному гулять в лесу опасно
так как можно встретить
застенчивую поняшку


Пинки ПайОдин из качественных изображений Пинки, который был испорчен самой нейронкой, своим последним штрихом. А точнее был испорчен нос у Пинки, хотя предпоследний кадр нейрирования был с нормальным носиком.
Розовенькое в синем
Кто сказал, что Пинки Пай не может быть элегантной?


РаритиЭти глаза напротив и чуть чуть выше
Раритетная драгоценность в золоте
Разрешите пригласить Вас на танец


ЭпплджекЯблочки в клеточку
Большие яблочки в клеточку
Кому яблочков?


Что по итогу. Нейрировать нефига не просто. Когда пишешь баллады в строке запроса и получаешь абы что, а когда пишешь одно предложение и получается довольно хорошо. Как работает этот «промт» не понятно.
И ещё заметил такую штуку в этом «Фооокусе», что всякую пошлятину он рисует быстрее и минимальными запросами и минимальными агрехами, типа кривых и отсутствующих пальцев и неправильной анатомии. А вот когда пытаешься запросит что-нить эстетичное и культурное, то прёт одна криворуко-кривопальцевая кривоногость. В принципе это и не удивительно, так как понятно на каком основном контенте тренируется эти нейросети.
Чтож, продолжаем продолжать.

15 комментариев

Xodok
+7
Если используешь чекпоинты на основе пони дифьюжена добавляй в промпт score_9, score_8_up, score_7_up и по аналогии дальше. Это грубо говоря «уровень качества» для неё. Чем выше скор тем лучше рисунок должен получаться
Star-Dragon
+4
Спасибо за подсказку. Знать бы ещё что такое чекпоинты и дифьюжен. Просто я пользователь на уровне запросов «нарисуй как Твайлайт Спаркл одетая в синее платье идёт по Понивилю».
Xodok
+4
Чекпоинты — это сами модели нейронной сети которые и генерируют твою картинку. Не знаю что там в фукусе стоит по умолчанию, но вот мой набор рабочий.

Они, как правило, все имеют разную выборку, стиль и особенности написания промпта. Универсальной нет. Поэтому если есть желание совершенствовать результат рано или поздно придётся в это вникать.
Star-Dragon
+4
Эти штуки там есть, но называются они там «модели». В Фооокусе есть, кажись, штук семь режимов рисования: реализм, аниме, пони, дефаулт какой-то и ещё. Сам Фооокус весит примерно 5Гб(со встроенным питоном), при выборе режимов он автоматом скачивает эти модели, которые весом каждый по 6 Гб. После всех скачиваний, этот Фооокусе стал весить более 60Гб.
И все эти режимы и модели можно совмещать в настройках, например выбрать режим аниме, модель пони, плюс можно выбрать из кучи несколько стилей рисования(пони, кинематограф ческий, фотографический) и всякие ползунки, переводя которые выбираешь разные степени направленности генерации(более реалистичный, более изобразительный).
В добавок есть функция загрузить рисунок и сгенерировать Фооокусом промт этого рисунка. Довольно интересная функция, с помощью которой можно более менее понять, как формировать запрос промта.
Интересно есть ли где-нить список стандартных запросов для улучшения качества изображения, по типу тех, что ты дал в комменте выше?
Xodok (ред.)
0
Хех нет. Реальность такова, что списков используемых в модели токенов никто не выкладывает. И хрен поймешь бывает влияют какие-то стилевые токены на результат или нет. Тут опять ссылка на мою фразу про различия в выборке моделей. Есть много гайдов и шаблонов в интернете как имитировать разные стили рисования, но их составляли под модели общего назначения, а включаешь пони и большая из них, если не вся, перестаёт работать.
Фукосовские стили работают так же. Они просто вместо тебя дописывают в промп шаблон токенов, который может работать, а может и нет.
Функция преобразования картинки в токены с базой помочь способна, но опять же она оперирует только общей библиотекой токенов, а пони и фури подобные модели имеют в себе очень много специфичных только им токенов притащенных с буры/621/данбуры.
Star-Dragon
0
Ну, тут мне сказать нечего, так как не знаю как там всё это фунциклирует. Могу лишь показать интерфейс
тут выбирают режимы
тут стили
тут модели
И при одном и том же запросе «антропоморфная пони пегас Рейнбоу Деш в спортивном костюме» и разных настройках, выдавал разные стили
1
2
3
Xodok
+2
… Я — просто продвинутый потребитель — думаю, что для таких простецких запросов лучше подошёл бы Шедеврум — онлайн-сервис. Все модели навроде Stable Diffusion, увы, воспринимают промпты подобно booru-доскам, а не синтаксически, как люди.
На версии 2.5 относительно эффективно применяю такой стиль промптинга: «детский рисунок цветными карандашами: (my little pony) Твайлайт Спаркл в синем платье по городку Понивиллю».
*всяких представителей не-пони оно будет рисовать плохо
**в версии 2.7 они что-то сломали — получаются гиперреалистичные рисунки, перестали работать мои указания на стиль. Сомневаюсь, что таким образом хорошие поняши будут получаться.
***для этой нейросети некоторые понятия просто не существуют (пространство, отрицание, кьютимарки) — их придётся изобретать.
Первая попытка генерации
Вторая попытка генерации, изменено на: "… в синем бальном платье с подолом до земли идёт мимо кафе Sugarcube Corner"
Третья попытка, изменено на: "… аликорн Твайлайт Спаркл в синем бальном платье с подолом до земли на задних ногах идёт по земле мимо здания в форме огромного кекса"

2.7, ладно.
STACORP (ред.)
+2
Про онлайны сказать ничего не могу, но вот этот Фооокус вроде более менее справляется с запросами типа длинных предложений. Конечно же не всегда даёт результат соответствующий запросу, к примеру на запрос «антропоморфная пони аликорн принцесса Селестия одетая в синие платье пьёт чай», он выдал довольно качественный рисунок, но содержание этого рисунка для бога «На гани».
Xodok
0
Очень хорошо получилось! Желаю дальнейших успехов в освоении этой технологии!
NovemberDragon
+3
Спасибо.
Xodok
+2
Отличное начало, друг (как и сами арты). Да, всё верно, нейросеть это далеко не «нажал пару кнопок и всё как-то само нарисовалось». Это труд, иногда близкий к настоящему рисованию. Но ты неплохо постарался и если это дело не забросишь, то со временем станешь создавать арты намного лучше. А если к этому ещё добавишь Фотошоп (где можно исправлять огрехи нейросети), то сможешь делать по-настоящему чудесные арты )))

Успехов тебе ^_^
Nuclear-pony-Jack
+4
Спасибо. Будем, как говорится, стараться.
Xodok
+2
Эхх, как же нейронки развились, классные арты получились!
EnotBrony
+1
Господи какие у Пинки наряды потрясающие
Birdseestars
+1
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.