Алиса AI стала лучше писать русский текст на изображениях

Русские надписи стали получаться заметно лучше

Яндекс обновил модель Alice AI ART, которая отвечает за генерацию изображений в Алисе AI. Главное изменение — нейросеть стала в 3 раза чаще создавать картинки с корректным русскоязычным текстом: без нечитаемых букв, странных символов и очевидных ошибок.

Для генераторов изображений это больное место. С красивой картинкой модели справляются всё увереннее, а вот надписи часто превращаются в набор похожих на буквы знаков. Особенно это заметно на русском языке, который хуже представлен в открытых наборах данных для обучения.

Коротко: Алиса AI стала лучше не просто рисовать, а именно аккуратнее работать с русским текстом внутри изображения.

Что изменили в модели

В Яндексе объясняют улучшение собственным русскоязычным датасетом. Компания собрала изображения с русским текстом, добавила детальную разметку и доработала саму модель.

После обновления выросло и общее качество генерации: по данным компании, доля изображений без визуальных искажений увеличилась на треть. Это не значит, что ошибки исчезли полностью, но для прикладных задач — карточек, баннеров, иллюстраций — разница может быть заметной.

Чтобы повысить шанс на нормальную надпись, Яндекс советует:

  • заключать текст в кавычки;

  • писать сложные слова заглавными буквами;

  • разбивать длинные фразы на короткие части.

Советы выглядят немного технически, но это нормальная реальность генеративных моделей: хороший результат часто зависит не только от модели, но и от того, как сформулирован запрос.

Больше внимания к русскому контексту

Отдельно Яндекс говорит, что Алиса AI стала лучше понимать русский культурный контекст. Для этого модель дополнительно обучали на русскоязычных промптах.

В источнике приводятся простые примеры: по запросу про русский народный ансамбль модель должна чаще показывать гармонистов и балалаечников, а по запросу про праздничный стол — икру, соленья и самовар. В космической теме Алиса AI может добавлять российских космонавтов.

Здесь важно не переоценивать формулировку «культурный код». На практике речь, скорее всего, о более точном наборе визуальных ассоциаций, которые модель выбирает по русскоязычному запросу. Для пользователя это как раз та мелочь, из-за которой картинка выглядит ближе к задаче, а не как универсальная иллюстрация из англоязычного интернета.

Где это пригодится бизнесу

Новая версия Alice AI ART доступна и на платформе Yandex AI Studio. Это уже не только пользовательская история, а инструмент для компаний, которым нужно быстро получать много визуальных материалов.

Яндекс приводит пример с карточками товаров для маркетплейсов: AI-агент может создавать изображение после появления информации о товаре в корпоративной базе. Также модель можно использовать для рекламных материалов, лендингов, презентаций и брошюр.

Отдельная цифра из контекста: 23,4% запросов к Алисе AI с компьютеров связаны с рабочими задачами. То есть Яндекс явно смотрит на Алису не только как на бытового помощника, но и как на рабочий инструмент.

Что пока стоит проверять руками

Даже после обновления генерация текста на изображениях остаётся зоной, где лучше не доверять результату вслепую. Ошибка в одной букве на баннере или товарной карточке может испортить всю работу, особенно если материал идёт в рекламу или на сайт.

Поэтому новость хорошая, но практичный вывод простой: модель стала полезнее, однако финальную проверку надписей всё равно должен делать человек.

Итог

Генерация изображений постепенно уходит от красивых абстрактных картинок к более прикладным задачам: баннерам, карточкам, рекламным макетам, презентациям. Для русского языка это особенно заметно, потому что многие модели долго работали с ним хуже, чем с английским.

В генераторах изображений часто раздражает не сама картинка, а мелкая кривая надпись, из-за которой результат нельзя сразу использовать. Но я бы не воспринимал рост «в 3 раза» как гарантию идеальных баннеров. Для черновиков, идей и быстрых визуалов Алиса AI становится удобнее, а вот материалы для публикации всё равно лучше открывать и проверять глазами. Особенно если там есть названия брендов, цены или юридически важные формулировки.

Источник: rb.ru

0Счет: 037Просмотры: 370Комментарии: 01Цитаты: 10Посты-цитаты: 00Оценки: 0

Подписка

Сейчас: Не подписан

Подписка: Не подписан
Войдите, чтобы подписаться на обсуждение.

Участники

0

Видимых участников обсуждения пока нет.

Лучшие комментарии

Лучшие комментарии появятся после первых оценок и ответов.

Активные ветки

Активные ветки появятся, когда у корневых комментариев будут ответы.

Комментарии

0 всего
Написать комментарий

Войдите, чтобы участвовать в обсуждении.

Комментариев пока нет. Можно начать ветку первым.

ymki

Цитаты из этого топика

Последние цитаты, созданные из текста топика и его комментариев.

ymkiЦитату донёс: ymki3,47Рейтинг цитирования: 3,47Пост1Публикации: 11Цитирующие: 10Посты-цитаты: 0
Генерация изображений постепенно уходит от красивых абстрактных картинок к более прикладным задачам

Цитаты-ответы и публикации в обсуждении

Отметились без комментария

Люди сохранили эту цитату в обсуждении, но не добавили свой ответ.

1