本周,"GPT-5 "戏剧性地启动了,但却遇到了第一个技术问题;印度继续在没有高额预算的情况下开发自己的语言模型,涵盖 22 种语言;人工智能视频正从病毒式传播走向 Netflix 系列。
1. GPT-5:期望很高,但新模式运行尚不顺利
OpenAI 正式推出了 GPT-5,作为用于编程和代理任务的最先进模型--有三个版本(标准、迷你、纳米),其智能可在从简约到高度复杂的四种模式中进行调整。该模型的性能经常优于 o3 和其他竞争对手,例如在编程测试(SWE-bench 74.9 %)、AIME-2025 数学竞赛(94.6 %)和 EQ-Bench 创意写作中。
然而,在部署过程中出现了一个问题--本应将查询路由到相应版本模型的路由器失灵了。这导致付费用户暂时无法访问以前版本的 GPT-4。
2. 印度在自己的法律硕士上下注:紧缩压力下的语言多样化基础设施
面对 "120 种语言和 19,500 种方言 "的挑战,印度正在利用有限的计算预算投资于本土语言管理解决方案。Sarvam AI(700 亿个参数,支持语音)、Soket AI、Gan.ai 和 Gnani.ai 等项目正在启动,这些项目都是为多语言使用而设计的。
政府的 "印度人工智能任务"(IndiaAI Mission)倡议已分配了 19,000 多台 GPU(包括 H100),用于开发基础设施能力和模型,包括 Sarvam AI 等。
3.从病毒式广告到电视节目场景,人工智能视频正在占领屏幕
生成式人工智能视频正从网络现象一跃成为主流。多尔兄弟工作室制作的病毒视频短片获得了 1600 万次观看,Genre.ai 工作室以不到 2000 美元的价格制作了一个游戏广告。甚至 Netflix 也在尝试使用人工智能生成的场景,如系列剧中的慢镜头。 伊特诺特人.
4.为基于代码的 LLM 自动生成合成数据
斯坦福大学、普林斯顿大学和阿里巴巴的研究人员设计了一款名为 SWE-smith 的工具,它能生成代码中错误修复的真实示例。例如,它使用了自动单元测试和变更还原过程。由此产生的数据--数据集、模型和代码--都是公开的。
批量 - DeepLearning.Ai 作者:Andrew Ng / gnews.cz - GH