DeepSeek, китайская модель искусственного интеллекта, которая потрясла технологическую индустрию и нарушила работу Уолл-стрит своей значительно низкой стоимостью и хорошей производительностью, имеет "некоторые реальные инновации" и является "хорошей новостью", сказал Сатья Наделла, генеральный директор Microsoft.
Наделла сделал это замечание во время ежеквартального отчета о прибылях компании в четверг, заявив, что ИИ ничем не отличается от обычных вычислительных разработок. Microsoft начала предлагать модель DeepSeek-R1 для выводов - модель ИИ, которая раскрывает свой "мыслительный процесс", чтобы пользователи могли проверить его результаты. Эта модель стала доступна пользователям облачной платформы Microsoft в тот же день.
Обвинения, несмотря на использование
Microsoft, крупный инвестор американского конкурента DeepSeek, компании OpenAI, также расследует, не получил ли китайский разработчик ИИ несанкционированно выходные данные OpenAI.
OpenAI сообщила СМИ, что у нее есть доказательства того, что DeepSeek использовала сервис OpenAI для обучения своих моделей искусственного интеллекта, что не соответствует условиям предоставления услуг OpenAI.
Однако ни OpenAI, ни Microsoft не предоставили доказательств.
Пока расследование продолжается, один из ставленников администрации Трампа уже обвинил DeepSeek в использовании "украденных" американских технологий.
Говард Лютник, кандидат на пост министра торговли, заявил в среду на встрече с американскими сенаторами, что администрация займется этим вопросом.
Тем временем Дэвид Сакс, советник президента Трампа по вопросам искусственного интеллекта, заявил, что есть "существенные доказательства" того, что DeepSeek "получила знания" из моделей OpenAI.
"Distillation нарушает большинство условий предоставления услуг, но ирония - или даже лицемерие - заключается в том, что Big Tech критикует ее", - заявил в среду инвестор в технологические проекты и преподаватель Корнельского университета Лутц Фингер. "Обучение ChatGPT на материалах Forbes или New York Times также нарушает их условия обслуживания".
Что такое "дистилляция"?
Дистилляция - это процесс, в ходе которого новая модель ИИ многократно запрашивает более крупную модель и учится на ее результатах.
Этот процесс описан в открытых научных работах DeepSeek, но исследователи заявили, что использовали его по-другому. По словам компании, они использовали модель DeepSeek-R1 для выводов в качестве "более крупной модели", которая "научила" другие модели, такие как Alibaba Qwen и Meta Llama, также быть способными к выводам.
Дистиллированные модели и оригинальный R1 были выпущены для бесплатного скачивания, что позволяет людям с менее мощными компьютерами или даже смартфонами запускать модели в автономном режиме с полным контролем, что невозможно для пользователей ChatGPT, поскольку модель, лежащая в основе сервиса OpenAI, скрыта даже от платных пользователей.
В социальных сетях появились сообщения о том, что DeepSeek иногда идентифицирует себя как ChatGPT, что может свидетельствовать о краже данных. Но, как и все другие модели ИИ, DeepSeek не всегда говорит правду. Предыдущая версия чат-бота Gemini от Google при запросе на китайском языке идентифицировала себя как бот Ernie от Baidu, но Baidu никогда не обвиняла Google в краже данных.