AI Daily — 2026 年 6 月 11 日

AI Coding + 具身智能专项 | 精选 8 条

🤖 AI Coding

1. Anthropic 发布 Claude Fable 5 & Mythos 5：AI 编程能力新标杆

Anthropic 于 6 月 9 日推出两款全新旗舰模型。Claude Fable 5（通用安全版）在软件工程、知识工作、视觉、科研等几乎所有基准测试上达到 SOTA，FrontierCode 评分居前沿模型之首，可仅凭截图重建网页应用源码。Claude Mythos 5（受限安全版）在药物设计中实现约 10 倍加速，分子生物学假说盲测获科学家偏好的概率约 80%。两模型定价均为 $10/百万输入 tokens、$50/百万输出 tokens，较 Mythos Preview 降价过半。

值得关注： Fable 5 在编码能力上全面领先，被 Claude Code 团队内部评价为"从检查它是否做对工作，转向检查它是否在做正确的工作"。Anthropic CEO Dario Amodei 同步发文《Policy on the AI Exponential》，呼吁政策制定跟上 AI 发展速度。

🔗 Anthropic 官方公告

2. FrontierCode 基准测试发布：最强模型代码通过率仅 13.4%

Cognition 发布全新 AI 编程评估基准 FrontierCode，由 20 多位顶级开源维护者手工制作 150 个任务（每个耗时 40+ 小时），依据 3000+ 条规则判断维护者是否愿意合并代码。该基准直指 SWE-Bench 等现有评测的软肋——超半数通过测试的代码实为不可维护的垃圾。

模型	最高难度通过率
Claude Opus 4.8	13.4%
GPT-5.5	6.3%
其余模型	1%–5%

值得关注： 即便最强模型，近九成代码仍无法通过有经验维护者审核。FrontierCode 将推动 AI 编程评估从"能不能写"升级为"写得好不好"，倒逼模型在代码可维护性、架构合理性上实质突破。

🔗 @AYi_AInotes on X

3. Anthropic 研究：AI 数小时内即可从安全补丁构建漏洞利用

Anthropic 安全团队研究发现，其 Mythos Preview 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用，成本仅需数千美元，且无需专业知识。在微软自动更新到达任何设备之前，该模型已完成 8 条完整攻击链。Anthropic 认为传统的"补丁→部署"节奏已经过时。

值得关注： 这是 AI 编程能力的"暗面"——代码生成能力越强，逆向工程和漏洞利用的门槛也越低。软件供应链安全的攻防节奏将被 AI 彻底改变，“补丁即公开漏洞细节"的时代可能到来。

🔗 The Decoder 报道

4. 小米 MiMo Code V0.1 开源：终端 AI 编程助手入场

小米正式开源终端 AI 编程助手 MiMo Code V0.1（MIT 许可），核心特性包括：

无限上下文：自动知识积累与无损压缩
Agent-模型深度协同：测试→审查→验证闭环
Compose 模式：规格→计划→构建→报告全流程
Claude Code 兼容：零成本迁移现有工作流
多模型支持：Anthropic、OpenAI、DeepSeek、Kimi、GLM 等
语音输入：基于 MiMo-V2.5-ASR

值得关注： 继摩尔线程 MusaCoder、Cohere North Mini Code 之后，小米入局让开源 AI 编程工具生态更加丰富。MIT 许可 + Claude Code 兼容是最大杀手锏，降低了开发者迁移门槛。

🔗 @XiaomiMiMo on X

5. Cohere 发布 North Mini Code + Claude Managed Agents 升级

Cohere North Mini Code：30B 参数 MoE 模型（3B 活跃参数），Apache 2.0 完全开源。SWE-Bench Verified pass@10 达 80.2%，Terminal-Bench v2 达 55.1%，专为智能体编码任务优化。

Claude Managed Agents 同步迎来重大升级：

定时运行（Cron）：Agent 可按计划自动执行周期性任务，无需自建调度器
Vaults 环境变量：密钥仅附加在网络边界，Agent 无法读取真实凭证

值得关注： 开源编码模型性价比持续突破（30B MoE 对标更大模型），Claude Managed Agents 从"手动触发"升级为"自主定时运行”，AI Agent 正在成为真正的数字员工。Rakuten、Ando 等企业已将定时 Agent 用于夜间数据同步、周度合规扫描等场景。

🔗 Cohere North Mini Code | Claude Managed Agents

6. Cursor 欧洲总部落子伦敦，SpaceX 手握 $600 亿收购选择权

AI 编程独角兽 Cursor 将欧洲总部设在伦敦，计划招聘约 200 名员工。关键数据：

B2B 年化营收约 26 亿美元
客户包括英国航空、英国石油、诺基亚等
SpaceX 拥有以 600 亿美元收购 Cursor 的选择权，或支付 100 亿美元开展全新合作
同期推出 Bugbot 重大更新：速度提升 3 倍，成本降低 22%，新增 /review 命令

值得关注： Cursor 26 亿美元 B2B 年化营收验证了 AI 编程工具的商业价值。SpaceX 的收购选择权意味着 AI 编程能力正在成为航天/硬科技等关键行业的核心基础设施。

🔗 IT之家报道 | Cursor Bugbot 更新

🦾 具身智能

7. 工信部+国资委联合启动人形机器人万台级实景实训专项行动

6 月 9 日，工业和信息化部、国务院国资委联合印发通知，正式启动 2026 年度人形机器人与具身智能实景实训专项行动。核心目标：

到 2026 年底：人形机器人等重点产品在代表性场景中完成应用验证和常态部署，开启"作业模式"
万台级规模落地：超过 10,000 台人形机器人投入商业使用
100+ 高价值场景：覆盖制造、物流、零售、医疗等领域
RaaS 模式推广：机器人即服务，企业可按工作绩效付费或经营租赁

值得关注： 这是继 6 月 1 日具身智能行业标准正式实施、6 月 3 日工信部发文后，国家层面再度加码。从"进工厂、进商场、进家庭"到"万台级规模 + 百个场景"，具身智能产业化已从政策设计进入执行落地的不可逆阶段。

🔗 财新报道 | 新华网

8. 华为云发布 CloudRobo：全球首个端到端具身 AI 开发平台

华为云在 INSPIRE 2026 大会上推出 CloudRobo，覆盖从数据、模型到部署、集成的全生命周期，基于 PB 级可信数据底座。核心能力包括：

数据与模型双评估系统
主动力控模型快速组装
机器人小时级上云、模型分钟级部署
国家地方共建人形机器人创新中心、Yijiahe Technology、上海交大联合展示

同期，GENISOM AI 在维也纳 ICRA 2026 首次亮相全栈具身智能系统（M1/L1 系列四足机器人 + 自研关节模组）；中联重科人形机器人 Z01 在土耳其 KOMATEK 2026 展出。

值得关注： 具身智能基础设施竞争进入"平台化"阶段。华为 CloudRobo 对标 NVIDIA Isaac GR00T，试图以"端到端开发平台 + 国产算力"降低机器人开发门槛。小时级上云、分钟级部署的效率，将加速具身智能从实验室走向产线。

🔗 @HuaweiCloud1 on X

📊 趋势观察

维度	关键信号
AI Coding 模型竞争	Fable 5 全面 SOTA，但 FrontierCode 揭示真实代码质量天花板仅 13.4%，评估标准亟待升级
AI 编程安全	Anthropic 证实 AI 数小时内即可武器化安全补丁，“补丁→攻击"时间窗口消失
开源编码工具	小米 MiMo Code + Cohere North Mini Code + 摩尔线程 MusaCoder，中国力量集体开源
Agent 自主化	Claude Managed Agents 定时运行 + Vaults，AI Agent 从"工具"进化为"数字员工”
AI 编程商业化	Cursor $26B ARR + SpaceX $60B 选择权，编程工具成为硬科技基础设施
具身智能政策	工信部+国资委万台级专项，从"鼓励探索"进入"量化考核"，产业化不可逆
具身智能平台化	华为 CloudRobo vs NVIDIA GR00T，端到端开发平台成为产业基础设施竞争焦点

📅 生成日期：2026-06-11 · 数据来源：AI HOT (aihot.virxact.com) · IT之家 · Bloomberg · Anthropic 官方 · Caixin Global

AI 日报 · 2026年6月11日