中国初创公司 DeepSeek 最近推出的一款高性能、低成本人工智能模型引发了全世界的关注。据称,DeepSeek-R1 的性能可与美国的替代产品相媲美,但该公司声称,其开发成本不到这些型号的十分之一。中国科技新闻门户网站 36Kr 于 2024 年 7 月采访了该公司的创始人梁文峰。
以下是经过翻译和编辑的访谈节选。
2024 年 5 月推出的大型语言模型 DeepSeek-V2 在硅谷引起了震动。您认为为什么会发生这种情况?
在美国,创新每天都在发生。在这种情况下,DeepSeek-V2 并没有什么特别之处。硅谷的人们感到惊讶,因为这种模式是由一家中国公司开发的。迄今为止,中国公司只是跟风,但这次我们作为创新者进入了这个领域。
DeepSeek 通过开放源代码发布其创新成果。你不担心其他公司滥用它的风险吗?您想如何建立自己的竞争优势?
对于改变固有思维的颠覆性技术而言,竞争优势只能在有限的封闭环境中得到保护。尽管美国 OpenAI 将其源代码保密,但无法阻止竞争对手的追赶。我们将在这个过程中不断成长,积累大量的专有技术,并建立起孵化创新的企业结构和文化。这就是我们的优势。
许多中国人工智能模型开发者都在为技术商业化而苦苦挣扎。DeepSeek 为什么决定先专注于基础研究?
因为我们认为,最重要的是顺应全球创新浪潮。 迄今为止,中国企业善于运用别人发明的创新技术,快速开发产品,赚取利润。但我们不应认为这是唯一的途径。我们最初的信念不是追求短期利益,而是走在技术发展的前沿,帮助整个生态系统成长。
人们常说,美国擅长创造新技术,而中国擅长将其应用于产品和服务。您对此有何看法?
中国不应再依赖他人的成就,而应随着经济增长逐步转向创新者的角色。在过去 30 年的信息技术发展中,中国选择了赚钱,而不是积极参与创新。创新并不一定是由商业驱动的,也可能源于纯粹的好奇心和创造欲。
在人工智能模型开发领域,即使是最先进的技术也未必具有绝对的竞争优势。DeepSeek 是如何应对这一挑战的?
我们相信,中国的人工智能技术不会永远追随前人的脚步。美国半导体公司英伟达(Nvidia)之所以能取得今天的地位,并非仅靠一家公司的努力,而是离不开西方科技界和产业界的支持。中国的人工智能产业也需要建立类似的生态系统。由于缺乏技术社区的支持和最新信息的获取,中国国内的芯片开发停滞不前。这就是为什么中国需要站在技术发展前沿的人才。
你们计划筹集资金吗?据一家媒体报道,贵公司的母公司正在考虑分拆 DeepSeek。
短期内,我们还没有筹资计划。对我们来说,比筹集资金更大的问题是美国对高端芯片出口的禁令。
有人说 DeepSeek 雇用的是 "天才 "工程师。这是真的吗?
我们的员工并非天才工程师。他们是中国一流大学的应届毕业生、博士生和刚刚完成学业的年轻人。
Yu Lili / gnews.cz