Meta ускоряет разработку собственных AI-чипов MTIA

*Meta рассказала о развитии собственной линейки AI-чипов MTIA — Meta Training and Inference Accelerator. Компания делает на них ставку как на часть инфраструктуры, которая должна обслуживать ИИ-функции для миллиардов пользователей: от рекомендаций до ассистентов и генеративных моделей.

Модели меняются быстрее, чем классический цикл разработки железа. Поэтому компания пытается выпускать новые поколения ускорителей чаще и точнее подстраивать их под реальные нагрузки.

Четыре поколения за короткий срок

После MTIA 100 и MTIA 200 компания ускорила разработку сразу по четырём следующим поколениям: MTIA 300, MTIA 400, MTIA 450 и MTIA 500. Часть из них уже используется или готовится к внедрению, а массовые развёртывания MTIA 450 и MTIA 500 запланированы на 2027 год.

По словам *Meta, в production уже работают сотни тысяч MTIA-чипов. Это важная деталь: речь не о лабораторном эксперименте, а о железе, которое постепенно встраивают в реальные сервисы компании.

Коротко: *Metaне отказывается от внешних решений, но хочет иметь собственный слой ускорителей для задач, где важны масштаб и стоимость.

Почему фокус смещается к inference

В материале отдельно подчёркивается, что новые MTIA всё больше оптимизируют под GenAI inference — то есть под запуск уже обученных моделей для ответа пользователям. Это логично: обучение больших моделей требует огромных ресурсов, но ежедневное обслуживание запросов миллиардов людей тоже становится отдельной дорогой задачей.

MTIA 300 изначально был ближе к задачам ranking and recommendation, то есть ранжированию и рекомендациям. MTIA 400 уже лучше адаптировали под GenAI, а MTIA 450 и 500 получили дополнительные оптимизации именно для генеративного inference.

Память, скорость и чиплеты

*Meta делает акцент на пропускной способности памяти HBM и модульной архитектуре. От MTIA 300 до MTIA 500 пропускная способность HBM выросла в 4,5 раза, а compute FLOPS — в 25 раз, если сравнивать заявленные параметры в линейке.

Для MTIA 450 компания удвоила HBM bandwidth относительно MTIA 400, а для MTIA 500 добавила ещё 50% к MTIA 450. В таких задачах память часто становится не менее важной, чем «сырая» вычислительная мощность: модели нужно быстро читать и передавать огромные объёмы данных.

*Meta также использует модульный подход с chiplets. Это позволяет обновлять отдельные блоки быстрее и не ждать несколько лет до следующего большого поколения.

Софт не менее важен, чем железо

Ещё один заметный акцент — совместимость с привычным стеком разработки. MTIA строится вокруг PyTorch, а также использует vLLM, Triton и подходы Open Compute Project. Для разработчиков внутри компании это должно снижать трение: модели можно переносить на MTIA без полного переписывания под новое железо. Стек поддерживает eager и graph modes, интеграцию с torch.compile и torch.export, а также инструменты мониторинга, профилирования и отладки для production-среды.

Где остаются вопросы

Материал *Meta подробно рассказывает о стратегии и технических улучшениях, но это всё же текст самой компании. В нём мало независимых сравнений с GPU и почти нет деталей о стоимости владения, энергопотреблении в реальных сценариях и ограничениях при разных типах моделей.

Тем не менее направление понятно. Большие AI-компании всё чаще хотят контролировать не только модели и приложения, но и железо под ними. Когда inference становится массовой услугой, собственный чип — это уже не имиджевый проект, а способ считать экономику на годы вперёд.

5. Почему это интересно

История MTIA показывает, что гонка в ИИ идёт не только вокруг моделей, но и вокруг инфраструктуры. Чем больше пользователей общается с AI-сервисами каждый день, тем важнее становятся стоимость одного запроса, память, охлаждение, сетевые задержки и удобство переноса моделей. *Meta фактически говорит: универсальные GPU остаются важны, но для части массовых задач компания хочет более точное собственное железо. Это может стать обычной логикой для крупных платформ, у которых есть достаточно масштаба.

Итог

Компания пытается сделать железо ближе к темпу развития моделей, и это выглядит разумно для такого масштаба. Но оценивать MTIA только по заявленным приростам нельзя: реальные преимущества проявятся в стоимости, стабильности и удобстве эксплуатации в дата-центрах. Для обычного пользователя это останется невидимым, но именно такие вещи будут определять, насколько доступными и быстрыми станут AI-функции внутри больших сервисов.

Источник: Meta AI

* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.

00 оценок
ЦитироватьПост-цитата
0Счет: 040Просмотры: 400Комментарии: 00Цитаты: 00Посты-цитаты: 00Оценки: 0

Подписка

Сейчас: Не подписан

Подписка: Не подписан
Войдите, чтобы подписаться на обсуждение.

Участники

0

Видимых участников обсуждения пока нет.

Лучшие комментарии

Лучшие комментарии появятся после первых оценок и ответов.

Активные ветки

Активные ветки появятся, когда у корневых комментариев будут ответы.

Комментарии

0 всего
Написать комментарий

Войдите, чтобы участвовать в обсуждении.

Комментариев пока нет. Можно начать ветку первым.

ymki

Цитаты из этого топика

Последние цитаты, созданные из текста топика и его комментариев.

Этот топик пока не цитировали.