Алиса AI стала лучше писать русский текст на изображениях
Русские надписи стали получаться заметно лучше
Яндекс обновил модель Alice AI ART, которая отвечает за генерацию изображений в Алисе AI. Главное изменение — нейросеть стала в 3 раза чаще создавать картинки с корректным русскоязычным текстом: без нечитаемых букв, странных символов и очевидных ошибок.
Для генераторов изображений это больное место. С красивой картинкой модели справляются всё увереннее, а вот надписи часто превращаются в набор похожих на буквы знаков. Особенно это заметно на русском языке, который хуже представлен в открытых наборах данных для обучения.
Коротко: Алиса AI стала лучше не просто рисовать, а именно аккуратнее работать с русским текстом внутри изображения.
Что изменили в модели
В Яндексе объясняют улучшение собственным русскоязычным датасетом. Компания собрала изображения с русским текстом, добавила детальную разметку и доработала саму модель.
После обновления выросло и общее качество генерации: по данным компании, доля изображений без визуальных искажений увеличилась на треть. Это не значит, что ошибки исчезли полностью, но для прикладных задач — карточек, баннеров, иллюстраций — разница может быть заметной.
Чтобы повысить шанс на нормальную надпись, Яндекс советует:
заключать текст в кавычки;
писать сложные слова заглавными буквами;
разбивать длинные фразы на короткие части.
Советы выглядят немного технически, но это нормальная реальность генеративных моделей: хороший результат часто зависит не только от модели, но и от того, как сформулирован запрос.
Больше внимания к русскому контексту
Отдельно Яндекс говорит, что Алиса AI стала лучше понимать русский культурный контекст. Для этого модель дополнительно обучали на русскоязычных промптах.
В источнике приводятся простые примеры: по запросу про русский народный ансамбль модель должна чаще показывать гармонистов и балалаечников, а по запросу про праздничный стол — икру, соленья и самовар. В космической теме Алиса AI может добавлять российских космонавтов.
Здесь важно не переоценивать формулировку «культурный код». На практике речь, скорее всего, о более точном наборе визуальных ассоциаций, которые модель выбирает по русскоязычному запросу. Для пользователя это как раз та мелочь, из-за которой картинка выглядит ближе к задаче, а не как универсальная иллюстрация из англоязычного интернета.
Где это пригодится бизнесу
Новая версия Alice AI ART доступна и на платформе Yandex AI Studio. Это уже не только пользовательская история, а инструмент для компаний, которым нужно быстро получать много визуальных материалов.
Яндекс приводит пример с карточками товаров для маркетплейсов: AI-агент может создавать изображение после появления информации о товаре в корпоративной базе. Также модель можно использовать для рекламных материалов, лендингов, презентаций и брошюр.
Отдельная цифра из контекста: 23,4% запросов к Алисе AI с компьютеров связаны с рабочими задачами. То есть Яндекс явно смотрит на Алису не только как на бытового помощника, но и как на рабочий инструмент.
Что пока стоит проверять руками
Даже после обновления генерация текста на изображениях остаётся зоной, где лучше не доверять результату вслепую. Ошибка в одной букве на баннере или товарной карточке может испортить всю работу, особенно если материал идёт в рекламу или на сайт.
Поэтому новость хорошая, но практичный вывод простой: модель стала полезнее, однако финальную проверку надписей всё равно должен делать человек.
Итог
Генерация изображений постепенно уходит от красивых абстрактных картинок к более прикладным задачам: баннерам, карточкам, рекламным макетам, презентациям. Для русского языка это особенно заметно, потому что многие модели долго работали с ним хуже, чем с английским.
В генераторах изображений часто раздражает не сама картинка, а мелкая кривая надпись, из-за которой результат нельзя сразу использовать. Но я бы не воспринимал рост «в 3 раза» как гарантию идеальных баннеров. Для черновиков, идей и быстрых визуалов Алиса AI становится удобнее, а вот материалы для публикации всё равно лучше открывать и проверять глазами. Особенно если там есть названия брендов, цены или юридически важные формулировки.
Источник: rb.ru
Подписка
Сейчас: Не подписан
Участники
0Видимых участников обсуждения пока нет.
Лучшие комментарии
Лучшие комментарии появятся после первых оценок и ответов.
Активные ветки
Активные ветки появятся, когда у корневых комментариев будут ответы.
Комментарии
0 всегоНаписать комментарий
Войдите, чтобы участвовать в обсуждении.
Комментариев пока нет. Можно начать ветку первым.
ymki
Цитаты из этого топика
Последние цитаты, созданные из текста топика и его комментариев.
Цитаты-ответы и публикации в обсуждении
Отметились без комментария
Люди сохранили эту цитату в обсуждении, но не добавили свой ответ.