AI Daily — 2026年6月10日
今日焦点:Anthropic Fable 5/Mythos 5 重磅发布 + Apple WWDC 2026 闭幕 + 中国具身智能万台级落地令
🤖 AI Coding
1. Anthropic 发布 Claude Fable 5 & Mythos 5:编码 SOTA + 科学发现加速 10 倍
Anthropic 于 6 月 9 日正式发布 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有基准上达到 SOTA,FrontierCode 评分居前沿模型之首,可仅凭截图重建 Web 应用源码。Stripe 称其"将数月工程压缩至数天"。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型定价均为 $10/$50 每百万输入/输出 token,较 Mythos Preview 降价过半。Fable 5 即日起至 6 月 22 日免费面向 Pro/Max/Team/企业用户开放。
值得关注: Anthropic 以"双模型"策略同时覆盖通用编码与前沿科研,Fable 5 在代码生成领域全面确立 SOTA,Mythos 5 则展现 AI 在科学发现中的杠杆效应。降价信号也表明大模型推理成本正在快速下降。
2. Claude Managed Agents 新增定时运行与环境变量 Vaults
Claude Managed Agents 在 Claude Platform 公开测试两项关键功能:代理可按 cron 计划自动执行周期任务(如夜间数据同步、周度合规扫描、每日摘要),无需用户自建调度器;vaults 新增环境变量支持,允许代理通过 CLI 进行认证请求,真实密钥仅附加在网络边界,代理无法读取。Rakuten、Ando、Milana 等团队已在生产中使用。
值得关注: 这标志着 AI Coding Agent 从"按需调用"进化到"自主定时运行",基础设施化趋势明显。Vaults 解决了企业级场景中的密钥安全难题。
来源:Claude Blog
3. FrontierCode 基准测试发布:最强模型代码维护者审核通过率仅 13.4%
Cognition(Devin 母公司)发布 FrontierCode 基准测试,由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000+ 规则判断代码是否可合并。结果令人警醒:Claude Opus 4.8 在最高难度档仅获 13.4%,GPT-5.5 为 6.3%,其余模型 1%-5%。报告指出 SWE-Bench 等超半数通过测试的代码实为"不可维护的垃圾"。
值得关注: 这是 AI 编程评估体系的重要转折点——从"能不能写"转向"写出来能不能用"。Fable 5 在该基准上的表现将是后续验证的关键指标。
4. Cohere 发布 North Mini Code:30B MoE 开源编码模型
Cohere 发布 North Mini Code,30B 参数 MoE 架构(3B 活跃参数),Apache 2.0 完全开源。在 Artificial Analysis Coding Index 上得分 33.4,超越 Qwen3.5、Gemma 4 等同类模型。后训练采用两阶段 SFT 和 RLVR,SWE-Bench Verified pass@10 达 80.2%,Terminal-Bench v2 达 55.1%,专为智能体编码任务优化。
值得关注: 开源编码模型竞争进一步升温,Cohere 以 Apache 2.0 许可证切入开发者生态。3B 活跃参数的高效架构意味着可以在消费级硬件上运行编码 Agent。
5. Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权
Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设办事处。据披露,SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规。
值得关注: Cursor 年化营收 26 亿美元验证了 AI Coding 工具的商业化潜力。SpaceX 的收购选择权暗示 AI Coding 与太空/物理基础设施的潜在协同。
来源:IT之家
🦾 具身智能
6. 工信部+国资委联合令:2026 年底人形机器人万台级规模落地
工信部、国资委 6 月 9 日联合印发通知,启动 2026 年度人形机器人与具身智能实景实训专项行动。核心目标:到 2026 年底,人形机器人等重点产品在代表性场景完成应用验证并常态部署,凝练 100+ 高价值场景,带动万台级规模落地。要求各省选取 20+ 场景单元(覆盖工业/服务/特种两类领域),央企不少于 10 个。六项重点任务涵盖:打造实景实训空间、组建创新联合体、攻关实用化作业技能、加强验证部署、强化要素保障、凝练成熟经验。鼓励"人形机器人即服务"商业模式创新。
值得关注: 这是继发改委"进工厂、进商场、进家庭"之后,中国具身智能最强政策推力。“万台级规模落地"目标标志着产业化从口号进入倒计时。鼓励 RaaS 模式有助于降低企业采购门槛。
📡 行业动态
7. Apple WWDC 2026 闭幕:Siri AI 登场,库克谢幕之作
苹果于 6 月 9 日凌晨举行 WWDC 2026,这是蒂姆·库克以 CEO 身份主持的最后一届开发者大会。核心发布:Siri AI 正式登场,推出独立 App,支持跨应用复杂任务、上下文理解、屏幕内容分析、连续多轮对话;Apple Intelligence 全面升级,底层融合 Gemini 技术,支持设备端运行与私有云计算;Core AI 框架面向开发者开放,3 行 Swift 即可调用 Claude/ChatGPT 等第三方模型。同时推出 Liquid Glass 设计语言、AI 照片编辑工具、儿童安全功能升级等。资本市场反应冷淡,发布会后苹果股价下跌。
值得关注: 库克谢幕 + AI 全面转型 = 苹果史上最重要的 WWDC。Siri AI 独立成 App、拥抱 Gemini、开放第三方模型三大信号表明苹果已从"AI 自研封闭"转向"平台开放”。Core AI 框架让 Claude Code 等工具在苹果生态中有了原生入口。
8. 中国准备 2950 亿美元 AI 基建计划 + 台湾考虑限制 AI 芯片对华出口
Bloomberg 报道,中国计划在未来五年投入约 2 万亿元人民币(约 2950 亿美元)建设全国数据中心,推动国内 AI 产业发展。同日,台湾当局据报正考虑对 AI 芯片出口中国大陆实施更严格管制,以进一步与美国出口限制对齐。此外,Apollo 与 Blackstone 联手 350 亿美元 AI 融资交易,可能重塑 AI 基础设施融资方式。
值得关注: 全球 AI 基建竞赛进入"万亿美元"级别。中国 2950 亿美元计划与 Apollo/Blackstone 350 亿美元交易形成两大融资范式。台湾芯片管制若落地,将进一步影响具身智能硬件供应链。
🔥 今日关键词
Fable 5 / Mythos 5 — WWDC 开放生态 — 万台级具身落地 — FrontierCode 新标尺 — 2950 亿 AI 基建
数据来源:AI HOT (aihot.virxact.com)、Bloomberg、Anthropic、Apple、工信部等 | 筛选标准:AI Coding + 具身智能方向,侧重产业影响力和技术里程碑