На этой неделе состоялся драматический запуск GPT-5, который столкнулся с первыми техническими проблемами, Индия продолжает разрабатывать собственные языковые модели на 22 языках без большого бюджета, а ИИ-видео переходит от вирусных хитов к сериалам на Netflix.

1. GPT-5: большие ожидания, но новая модель пока работает не очень гладко

OpenAI официально представила GPT-5 как самую продвинутую модель для программирования и решения агентских задач - в трех версиях (Standard, Mini, Nano), с интеллектом, который можно настраивать в четырех режимах, от минималистичного до очень сложного. Эта модель регулярно превосходит по производительности o3 и других конкурентов - например, в тестах на программирование (SWE-bench 74,9 %), в математическом конкурсе AIME-2025 (94,6 %) и в творческом письме на EQ-Bench.

Однако во время развертывания возникла проблема - маршрутизатор, который должен был направлять запросы к соответствующей версии модели, дал сбой. Это привело к временному восстановлению доступа к предыдущим версиям GPT-4 для платных пользователей.

2. Индия делает ставку на собственный LLM: лингвистически разнообразная инфраструктура под давлением жесткой экономии

Столкнувшись с проблемами "120 языков и 19 500 диалектов", Индия инвестирует в собственные решения LLM при ограниченном бюджете на вычисления. Запускаются такие проекты, как Sarvam AI (70 миллиардов параметров с голосовой поддержкой), Soket AI, Gan.ai и Gnani.ai - все они предназначены для многоязычного использования.

В рамках правительственной инициативы IndiaAI Mission было выделено более 19 000 графических процессоров (включая H100) для развития инфраструктурных возможностей и моделей, в том числе Sarvam AI и других.

3. От вирусной рекламы до сцен телешоу - видео с искусственным интеллектом захватывает экраны

Генеративное видео с искусственным интеллектом переходит из разряда интернет-феноменов в мейнстрим. Студия The Dor Brothers выпустила вирусные видеоролики с 16 миллионами просмотров, а студия Genre.ai создала рекламу игры менее чем за 2 000 долларов. Даже Netflix экспериментирует с генерируемыми искусственным интеллектом сценами, такими как замедленная съемка в сериале The Eternaut.

4. Автоматизированная генерация синтетических данных для LLM на основе кодов

Исследователи из Стэнфорда, Принстона и Alibaba разработали инструмент SWE-smith, который генерирует реалистичные примеры исправления ошибок в коде. Например, он использует автоматизированные модульные тесты и процессы отмены изменений. Полученные данные - набор данных, модель и код - находятся в открытом доступе.

The Batch - DeepLearning.Ai от Эндрю Нг / gnews.cz - GH