微软首席执行官萨提亚-纳德拉(Satya Nadella)表示,中国的人工智能模型DeepSeek以其显著的低成本和良好性能震惊了科技行业并颠覆了华尔街,它拥有 "一些真正的创新","都是好消息"。
纳德拉是在周四的公司季度财报电话会议上发表这一评论的,他说人工智能与普通的计算发展没有什么不同。微软已经开始提供用于推理的 DeepSeek-R1 模型,这种人工智能模型会显示其 "思考过程",以便用户检查其结果。微软云平台的用户当天就可以使用这一模型。
尽管使用了
作为 DeepSeek 在美国的竞争对手 OpenAI 的主要投资者,微软也在调查一家中国人工智能开发商是否以未经授权的方式获取了 OpenAI 的输出数据。
OpenAI 已告知媒体,它有证据表明 DeepSeek 一直在使用 OpenAI 服务来训练其人工智能模型,这种行为不符合 OpenAI 的服务条款。
然而,OpenAI 和微软都没有提供证据。
虽然调查仍在继续,但特朗普政府任命的一名官员已经指责 DeepSeek 使用了 "偷来的 "美国技术。
商务部长提名人霍华德-卢特尼克(Howard Lutnick)周三在与美国参议员会面时表示,政府将解决这一问题。
与此同时,特朗普总统的人工智能顾问大卫-萨克斯(David Sacks)表示,有 "实质性证据 "表明 DeepSeek 从 OpenAI 模型中 "获取了知识"。
"技术投资人、康奈尔大学讲师鲁茨-芬格(Lutz Finger)周三表示:"蒸馏将违反大多数服务条款,但大科技公司却批评它,这真是讽刺,甚至可以说是虚伪。"在《福布斯》或《纽约时报》的内容上训练 ChatGPT 也违反了它们的服务条款。"
什么是 "蒸馏"?
蒸馏是一个新的人工智能模型反复查询较大模型并从其输出中学习的过程。
DeepSeek 的公开研究论文中描述了这一过程,但研究人员表示,他们以不同的方式使用了这一过程。据该公司称,他们使用 DeepSeek-R1 模型进行推理,将其作为一个 "更大的模型","教导 "其他模型,如阿里巴巴 Qwen 和 Meta Llama,使其也具备推理能力。
经过提炼的模型和原始 R1 已发布供免费下载,这样,电脑性能较差甚至智能手机性能较差的用户也可以离线运行这些模型,并对其进行完全控制,而这对 ChatGPT 用户来说是不可能的,因为 OpenAI 服务背后的模型即使对付费用户也是隐藏的。
社交媒体帖子显示,DeepSeek 有时会将自己标识为 ChatGPT,这可能是数据被盗的证据。但与所有其他人工智能模型一样,DeepSeek 并不总是说实话。谷歌双子座聊天机器人之前的一个版本在被中文询问时,将自己标识为百度的厄尼机器人,但百度从未指控谷歌窃取数据。