AI Daily — 2026年5月28日

聚焦方向： AI Coding · 具身智能
数据来源： AITNTNews、xix.ai、BuildFastWithAI
筛选标准： 技术突破、产业拐点、开源生态、资本动向

📋 本期摘要

今日 AI 编程赛道迎来里程碑级事件——开源 Agent 首次正面击败 OpenAI Codex；中国厂商闯入全球编程榜前二；Claude Code 持续迭代强化安全与可观测性。具身智能方面，触觉感知赛道获资本认可，小米开源 VLA 训练流程为行业注入活水，UIUC/Meta/Stanford 联合综述揭示 Claude Code 与机器人 Agent 的底层统一架构。

🧠 AI Coding（5条）

1. 🔥 开源 Hermes Agent 首次击败 OpenAI Codex — CLI 任务 6:5 胜出

开源 Hermes Agent（Python 编写）在 11 项 CLI 任务基准测试中以 6:5 击败 OpenAI Codex（Rust 编写）。经三项工程优化后启动时间从 701ms 降至 258ms，上线三个月 GitHub 星标突破 16 万。

值得关注： 这是开源 Agent 首次在标准化基准上正面击败闭源商业产品，标志着 AI 编程工具从"模型卡位战"进入"Agent 工程能力竞争"阶段。Python 生态的灵活性在 Agent 架构上展现了相对于 Rust 的优势。

📎 来源：AITNTNews

2. 🚀 Qwen3.7-Max 闯入全球编程榜前二 — 中国厂商首次

阿里通义千问 Qwen3.7-Max 在 Code Arena 编程榜获 1541 分，位列全球第四 / 中国厂商第二，成为前五中唯一非 Claude 模型。这是中国 AI 模型首次闯入全球编程能力前二阵营。

值得关注： 此前全球编程榜长期由 Anthropic Claude 系列垄断前五。Qwen3.7-Max 的突围标志着中国 AI 在编程这一高价值赛道具备了与最前沿模型正面对抗的能力，DeepSeek V4-Pro 降价 + 计划构建中国版 Claude Code 形成工具链闭环。

📎 来源：AITNTNews

3. 🔧 Claude Code v2.1.152 发布 — 用量分析 + PowerShell 安全修复

Claude Code 最新版本 v2.1.149-152 带来 30+ 更新：

/usage 命令增强：按 skills、subagents、plugins、MCP 服务器等维度展示用量明细
安全修复（CRITICAL）：修复 PowerShell cd 函数权限绕过漏洞（v2.1.149）
Markdown GFM 任务列表渲染、键盘友好 diff 滚动等体验优化

值得关注： 用量分析功能的细化意味着 Claude Code 正在从"开发者工具"演化为"企业级可观测性平台"，为企业核算 ROI 提供数据基础。PowerShell 安全漏洞的修复也提醒：AI 编程工具的本地权限管理是尚待解决的安全课题。

📎 来源：BuildFastWithAI

4. 🛡️ Claude Security 公测 — 架构级代码漏洞扫描

Anthropic 发布 Claude Security 企业版公测工具，运行于 Claude Opus 4.7，能推理跨大型代码库的组件交互，识别架构级漏洞、权限提升路径和认证绕过模式——这是传统静态分析工具无法做到的。

值得关注： 代码安全正在成为 AI 编程工具的第二战场。Claude Security 从"帮你写代码"延伸到"确保代码安全"，意味着 AI 编程从效率工具向全生命周期质量保障平台进化。KPMG 已将网络安全列为 Claude 初始部署领域之一。

📎 来源：BuildFastWithAI

5. 📱 谷歌 AI Studio 一周生成 25 万个 Android App — Vibe Coding 加速普及

谷歌 Google AI Studio 上线免费生成原生 Android App 功能，用户用自然语言描述需求即可生成可安装 APK。上线一周已创建超 25 万个 App，99% 以上创作者无 Android 开发经验。

值得关注： 这是"Vibe Coding"从概念到主流的关键节点——编程门槛从"学习语法"降到"用自然语言描述需求"。与前几日 DeepSeek 研究员用 Agent 自动写论文、腾讯"吐司"免费手搓 App 形成呼应，AI 编程正在从专业开发者工具走向全民创造平台。

📎 来源：AITNTNews

🤖 具身智能（3条）

6. 🖐️ NeoteAI 触觉具身完成近亿元天使轮 — 触觉感知新赛道获资本认可

上海新智具身（NeoteAI）宣布完成近亿元天使轮融资，专注触觉具身智能研发，同步布局视触觉传感器、数据采集平台与触觉大模型，已在工业场景落地 POC 验证。

值得关注： 此前具身智能融资多集中在运动控制和视觉感知，触觉作为机器人精细操作的"最后一厘米"长期被忽视。NeoteAI 的高额天使轮标志着资本开始关注具身智能的感知全栈能力，触觉大模型或将成为继 VLA 之后的下一波技术热点。

📎 来源：AITNTNews

7. 🔓 小米开源 VLA 模型高精度后训练流程 — 具身智能开源生态添新兵

小米开源高精度 VLA（Vision-Language-Action）模型完整后训练流程，为机器人操控领域提供可复现、可改进的开源基线。

值得关注： VLA 是连接视觉-语言-动作的具身智能核心架构，但目前高质量训练流程多被头部公司闭源。小米这一开源动作延续了其在机器人领域的开放策略，有望加速学术界和中小企业的 VLA 研究。结合复旦大学 0.9B 参数 VLA 真机成功率 90% 的突破，轻量化 VLA 路线正加速走向实用。

📎 来源：xix.ai

8. 📜 UIUC/Meta/Stanford 联合综述：Claude Code 与机器人 Agent 共享底层机制

UIUC、Meta、Stanford 联合发布 102 页综述（引用 478 篇文献），提出"代码作为 Agent Harness“三层架构，阐明代码化执行是 Claude Code 到机器人 Agent 的共同底层机制，已应用于编程、机器人、游戏、科学研究、办公自动化五大领域。

值得关注： 这篇综述提出了一个根本性洞见——AI Coding 和具身智能并非两个独立赛道，而是共享"代码作为执行桥梁"的统一架构。这意味着 AI Coding 领域的能力突破（如多步推理、工具调用、错误恢复）将直接影响具身智能的进展，两个赛道的人才、技术、方法论正在加速融合。

📎 来源：AITNTNews

📊 本期速览

维度	要点
🔑 标志性事件	开源 Hermes Agent 首次击败 OpenAI Codex，宣告 Agent 工程能力竞争时代到来
🇨🇳 中国突破	Qwen3.7-Max 闯入全球编程前二，DeepSeek V4-Flash 登顶全球调用量第一
🏢 企业 AI	KPMG 向 27.6 万员工部署 Claude，四大会计师事务所 AI 竞赛白热化
🦾 具身智能	触觉感知赛道获近亿融资，VLA 开源生态加速，Coding-Robotics 底层统一架构获学术验证
📱 Vibe Coding	谷歌一周 25 万 App 标志着自然语言编程走向全民化

🔮 趋势洞察

AI Coding 竞争从"模型争霸"进入"Agent 工程能力"阶段 — Hermes 以 Python + 工程优化击败 Rust Codex，说明 Agent 架构和工程效率正在超越模型原始能力成为决定性因素。
中国 AI 编程力量集体崛起 — Qwen + DeepSeek + Hermes 形成多层次矩阵，从基础模型到 Agent 工具链到开源生态全面覆盖，全球编程工具格局正在被重塑。
AI Coding 与具身智能底层架构统一 — UIUC 等机构的综述揭示了两者共享"代码化执行"机制，Cross-domain 人才培养和技术迁移将成为下一阶段关键。
“Vibe Coding"从概念到基础设施 — 谷歌、腾讯等大厂密集推出零代码 App 生成工具，AI 编程的用户群体正在从千万级开发者扩展到数十亿普通用户。

本报告由 WorkBuddy AI 自动化流程生成 | 2026-05-28 08:00 CST

AI 日报 · 2026年5月28日

AI 日报 · 2026年5月28日

AI Daily — 2026年5月28日

📋 本期摘要

🧠 AI Coding（5条）

1. 🔥 开源 Hermes Agent 首次击败 OpenAI Codex — CLI 任务 6:5 胜出

2. 🚀 Qwen3.7-Max 闯入全球编程榜前二 — 中国厂商首次

3. 🔧 Claude Code v2.1.152 发布 — 用量分析 + PowerShell 安全修复

4. 🛡️ Claude Security 公测 — 架构级代码漏洞扫描

5. 📱 谷歌 AI Studio 一周生成 25 万个 Android App — Vibe Coding 加速普及

🤖 具身智能（3条）

6. 🖐️ NeoteAI 触觉具身完成近亿元天使轮 — 触觉感知新赛道获资本认可

7. 🔓 小米开源 VLA 模型高精度后训练流程 — 具身智能开源生态添新兵

8. 📜 UIUC/Meta/Stanford 联合综述：Claude Code 与机器人 Agent 共享底层机制

📊 本期速览

🔮 趋势洞察