AI Daily — 2026年5月27日
聚焦方向:AI Coding · 具身智能
筛选标准:当日重大动态 / 行业结构性变化 / 技术突破 / 值得长期追踪的信号
本期共精选 8条
🤖 AI Coding
1. Grok 5(V9-Medium)1.5万亿参数训练完成,偷师 Cursor 狂练编程
事件: 5月25日凌晨,马斯克官宣 xAI 旗下 Grok 基座模型 V9-Medium 训练完成。参数规模达 1.5万亿(现役 v8-small 的3倍),专为 NVIDIA Blackwell 架构优化。引发行业震动的是其训练策略:大量使用 Cursor 编程数据进行特化训练,剑指编程赛道。目前已进入 SFT 阶段,RL 即将启动,预计 2-3周内正式发布。同期 AI 编程工具 Grok Build 已进入早期 Beta 测试。
值得关注的原因:
- Cursor 数据作为"编程能力喂养源"被头部玩家明牌使用,这意味着 AI 编程工具的用户行为数据正在成为下一阶段模型能力的关键燃料
- 1.5T 参数 + 编程特化 = 6月四家前沿实验室(Anthropic/OpenAI/Google/xAI)将在编程赛道短兵相接
- xAI 从"通用聊天"转向"编程垂直",标志着 AI 编程已成所有人必争之地
来源: xAI 官方 / 36氪 / chinaz
2. 阿里 Qwen3.7-Max 编程能力跃居全球第二,超越 GPT-5.5
事件: 5月26日,第三方编程评测平台 Code Arena 公布最新榜单。阿里巴巴 Qwen3.7-Max 以 1541分 排名全球第二,超越 GPT-5.5 和 Gemini 3.5 Flash,仅次于 Claude 系列。Code Arena 采用开发者真实场景盲测,要求模型完整生成可交互 Web 应用并进行匿名 PK,公信力较高。
值得关注的原因:
- 中国模型首次在编程评测中系统性超越 GPT 旗舰和 Gemini,此前 Qwen3.7-Max 已在多项基准中展现竞争力,Code Arena 第二名是编程能力的里程碑式验证
- 结合此前 Qwen3.7-Max 支持接入 Claude Code 工具链、自主运行35小时的特性,阿里正在打造"模型+工具链"双重竞争力
- 中国模型编程能力的快速提升将加速 AI Coding 工具链的国产替代进程
来源: Code Arena / 网易科技 / Edgen
3. George Hotz 发长文警告:AI 编程代理是"代价高昂的错误"
事件: Comma.ai 创始人、知名程序员 George Hotz 发表《The Eternal Sloptember》博文,基于 6个月真实项目测试,警告大规模采用 AI 编程代理将系统性降低软件质量。核心论点:AI 生成代码"看起来能用"但隐藏逻辑缺陷,团队容易把代码产量误当作工程能力。这与 Andrej Karpathy"AI 已永久改变编程"的立场形成鲜明对立。
值得关注的原因:
- 这是 AI 编程领域迄今最重量级的"反思派"声音,来自亲手写代码的一线顶级工程师,而非旁观评论家
- Hotz 与 Karpathy 的对立恰好揭示了 AI 编程的核心矛盾:效率与质量的权衡尚未解决
- 此前 Mitchell Hashimoto 也批评企业 AI 工作流是"空洞生产力表演",行业反思浪潮正在积累
来源: George Hotz 博客 / IC.Work / AIDailyPost
4. 面壁智能发布 ForgeTrain:AI 自己写代码训练 AI,从此闭环
事件: 面壁智能推出全球首个完全由 AI 编写的生产级大模型预训练框架 ForgeTrain,性能超越英伟达 Megatron 标杆,在华为昇腾上训练加速 10%。基于该框架训练的端侧模型 MiniCPM5-1B(1B参数)同尺寸性能第一,已在终端设备上本地运行。代码和模型均已开源。
值得关注的原因:
- “AI造AI"的里程碑事件:AI 不仅是被训练对象,还参与了自身训练基础设施的构建,形成从框架到模型的完整闭环
- 用 AI 写训练代码意味着模型迭代的工程瓶颈可能被 AI 自身突破,“人类工程师写框架→AI训练→AI写框架→更好的AI训练"正反馈或将加速
- 华为昇腾兼容 + 端侧部署,对国产 AI 芯片生态和终端 AI 落地均有实际推动意义
来源: AITNTNews / 面壁智能官方
5. DeepSeek V4 Pro 永久降价75%,计划构建"中国版 Claude Code”
事件: 5月22日,DeepSeek 官方宣布 V4-Pro 模型 API 永久降至原价1/4,同时完成输出提速与服务扩容,默认支持 500并发。更具战略意义的是,DeepSeek 明确表示正在计划构建中国版 Claude Code,以"蜜雪冰城式"极致性价比路线切入 AI 编程工具市场。
值得关注的原因:
- DeepSeek 的降价并非孤立事件,结合"中国版 Claude Code"计划,这是中国 AI 编程赛道从"模型层"向"工具链/产品层"升级的信号
- 价格战+工具链=双重施压,将进一步拉低开发者使用 AI 编程的门槛
- DeepSeek 的策略与 Anthropic"高定价+企业级服务"形成鲜明对比,“编程 AI 的平价替代"是否能形成差异化市场值得关注
来源: DeepSeek 官方 / AITNTNews / CSDN
🦾 具身智能
6. 宇树科技6月1日科创板IPO上会,“具身智能第一股"临门一脚
事件: 上交所公告定于 6月1日 召开上市审核委员会审议会议,审核宇树科技科创板首发事项。从3月20日受理到上会仅 66天,刷新科创板审核纪录。拟募资 42.02亿元,2025年营收 16.99亿元,人形机器人业务占比超 50%,初始发行市值预计至少 420亿元。
值得关注的原因:
- 这是 A 股历史上首个以"人形机器人+具身智能"为核心业务的 IPO,其成功与否将定调整个赛道的资本市场定价逻辑
- 66天"闪电上会"体现了监管层对具身智能赛道的政策倾斜
- 此前天机智能10亿融资、云深处IPO受理,到宇树上会,中国具身智能资本化进入快车道
来源: 上交所公告 / 北京商报 / 中国青年网
7. 擎朗智能发布 XMAN-L1:136cm 商业服务人形机器人即插即用
事件: 5月26日,擎朗智能正式发布小尺寸人形机器人 XMAN-L1。身高 136cm,配备 42个仿生自由度,膝关节峰值扭矩 132N·m,端侧算力 100TOPS。已接入豆包、腾讯等大模型实现自然语言对话,面向商场、酒店等商业服务场景,发布即上岗。
值得关注的原因:
- 代表具身智能从"工业制造"向"商业服务"渗透的产品化趋势,轻量+低成本+即插即用=加速规模化
- 接入豆包/腾讯大模型表明:具身机器人的"大脑"正在走向"多模型接入"的开放生态,而非封闭自研
- 擎朗智能此前以商用配送机器人起家,推出人形机器人意味着商用服务机器人企业正集体"人形化”
来源: IT之家 / 界面新闻 / 腾讯新闻
8. 上海交大 Evo-Depth:0.9B 参数 VLA 真机成功率90%,空间感知不再靠堆算力
事件: 上海交大 MINT 团队提出 Evo-Depth 方案,仅约 0.9B 参数,通过紧凑的隐式深度编码为 VLA(视觉-语言-动作)模型补充空间感知能力,不增加硬件负担。真机平均成功率约 90%,代码权重已开源。
值得关注的原因:
- 打破了"增强空间感知=增加算力/传感器"的固有思维,证明算法优化可以大幅降低具身智能的硬件门槛
- 0.9B 参数的量级意味着该方案可直接部署在端侧芯片上,对机器人量产降本有现实意义
- VLA 模型是当前具身智能的主流技术路线,Evo-Depth 的"补短板"思路具有广泛适用性
来源: AITNTNews / 腾讯云开发者社区 / 上海交大 MINT 团队
📊 本期趋势观察
| 趋势 | 信号 |
|---|---|
| AI Coding 编程赛道军备竞赛升级 | Grok 5 编程特化 + Qwen3.7-Max 全球第二 + DeepSeek 降价建工具链,编程成为 AI 模型能力检验的第一战场 |
| AI 编程"质量反思"形成浪潮 | George Hotz 警告 + Mitchell Hashimoto 批评,行业从"能不能写"转向"写得好不好” |
| “AI 造 AI"闭环首次实现 | 面壁 ForgeTrain 证明 AI 可编写生产级训练框架,自我进化能力迈出关键一步 |
| 具身智能资本化进入"IPO 时代” | 宇树科技闪电上会→6月1日审议,赛道从融资阶段进入公众市场定价阶段 |
| 具身智能从工业走向服务 | 擎朗 XMAN-L1 即插即用 + 接入第三方大模型,具身机器人消费化加速 |
| 轻量化路线成具身智能关键突破方向 | Evo-Depth 0.9B 达90%成功率,算法优化比堆算力更有效 |
数据来源:AITNTNews、xix.ai、Code Arena、IT之家、36氪、新浪财经、上交所公告等
生成时间:2026-05-27 08:00 GMT+8