AI 日报 · 2026年5月28日

AI 日报 · 2026年5月28日

AI Daily — 2026年5月28日

聚焦方向: AI Coding · 具身智能
数据来源: AITNTNews、xix.ai、BuildFastWithAI
筛选标准: 技术突破、产业拐点、开源生态、资本动向


📋 本期摘要

今日 AI 编程赛道迎来里程碑级事件——开源 Agent 首次正面击败 OpenAI Codex;中国厂商闯入全球编程榜前二;Claude Code 持续迭代强化安全与可观测性。具身智能方面,触觉感知赛道获资本认可,小米开源 VLA 训练流程为行业注入活水,UIUC/Meta/Stanford 联合综述揭示 Claude Code 与机器人 Agent 的底层统一架构。


🧠 AI Coding(5条)

1. 🔥 开源 Hermes Agent 首次击败 OpenAI Codex — CLI 任务 6:5 胜出

开源 Hermes Agent(Python 编写)在 11 项 CLI 任务基准测试中以 6:5 击败 OpenAI Codex(Rust 编写)。经三项工程优化后启动时间从 701ms 降至 258ms,上线三个月 GitHub 星标突破 16 万

值得关注: 这是开源 Agent 首次在标准化基准上正面击败闭源商业产品,标志着 AI 编程工具从"模型卡位战"进入"Agent 工程能力竞争"阶段。Python 生态的灵活性在 Agent 架构上展现了相对于 Rust 的优势。

📎 来源:AITNTNews


2. 🚀 Qwen3.7-Max 闯入全球编程榜前二 — 中国厂商首次

阿里通义千问 Qwen3.7-Max 在 Code Arena 编程榜获 1541 分,位列全球第四 / 中国厂商第二,成为前五中唯一非 Claude 模型。这是中国 AI 模型首次闯入全球编程能力前二阵营。

值得关注: 此前全球编程榜长期由 Anthropic Claude 系列垄断前五。Qwen3.7-Max 的突围标志着中国 AI 在编程这一高价值赛道具备了与最前沿模型正面对抗的能力,DeepSeek V4-Pro 降价 + 计划构建中国版 Claude Code 形成工具链闭环。

📎 来源:AITNTNews


3. 🔧 Claude Code v2.1.152 发布 — 用量分析 + PowerShell 安全修复

Claude Code 最新版本 v2.1.149-152 带来 30+ 更新:

  • /usage 命令增强:按 skills、subagents、plugins、MCP 服务器等维度展示用量明细
  • 安全修复(CRITICAL):修复 PowerShell cd 函数权限绕过漏洞(v2.1.149)
  • Markdown GFM 任务列表渲染、键盘友好 diff 滚动等体验优化

值得关注: 用量分析功能的细化意味着 Claude Code 正在从"开发者工具"演化为"企业级可观测性平台",为企业核算 ROI 提供数据基础。PowerShell 安全漏洞的修复也提醒:AI 编程工具的本地权限管理是尚待解决的安全课题。

📎 来源:BuildFastWithAI


4. 🛡️ Claude Security 公测 — 架构级代码漏洞扫描

Anthropic 发布 Claude Security 企业版公测工具,运行于 Claude Opus 4.7,能推理跨大型代码库的组件交互,识别架构级漏洞、权限提升路径和认证绕过模式——这是传统静态分析工具无法做到的。

值得关注: 代码安全正在成为 AI 编程工具的第二战场。Claude Security 从"帮你写代码"延伸到"确保代码安全",意味着 AI 编程从效率工具向全生命周期质量保障平台进化。KPMG 已将网络安全列为 Claude 初始部署领域之一。

📎 来源:BuildFastWithAI


5. 📱 谷歌 AI Studio 一周生成 25 万个 Android App — Vibe Coding 加速普及

谷歌 Google AI Studio 上线免费生成原生 Android App 功能,用户用自然语言描述需求即可生成可安装 APK。上线一周已创建超 25 万个 App99% 以上创作者无 Android 开发经验

值得关注: 这是"Vibe Coding"从概念到主流的关键节点——编程门槛从"学习语法"降到"用自然语言描述需求"。与前几日 DeepSeek 研究员用 Agent 自动写论文、腾讯"吐司"免费手搓 App 形成呼应,AI 编程正在从专业开发者工具走向全民创造平台。

📎 来源:AITNTNews


🤖 具身智能(3条)

6. 🖐️ NeoteAI 触觉具身完成近亿元天使轮 — 触觉感知新赛道获资本认可

上海新智具身(NeoteAI)宣布完成近亿元天使轮融资,专注触觉具身智能研发,同步布局视触觉传感器、数据采集平台与触觉大模型,已在工业场景落地 POC 验证。

值得关注: 此前具身智能融资多集中在运动控制和视觉感知,触觉作为机器人精细操作的"最后一厘米"长期被忽视。NeoteAI 的高额天使轮标志着资本开始关注具身智能的感知全栈能力,触觉大模型或将成为继 VLA 之后的下一波技术热点。

📎 来源:AITNTNews


7. 🔓 小米开源 VLA 模型高精度后训练流程 — 具身智能开源生态添新兵

小米开源高精度 VLA(Vision-Language-Action)模型完整后训练流程,为机器人操控领域提供可复现、可改进的开源基线。

值得关注: VLA 是连接视觉-语言-动作的具身智能核心架构,但目前高质量训练流程多被头部公司闭源。小米这一开源动作延续了其在机器人领域的开放策略,有望加速学术界和中小企业的 VLA 研究。结合复旦大学 0.9B 参数 VLA 真机成功率 90% 的突破,轻量化 VLA 路线正加速走向实用。

📎 来源:xix.ai


8. 📜 UIUC/Meta/Stanford 联合综述:Claude Code 与机器人 Agent 共享底层机制

UIUC、Meta、Stanford 联合发布 102 页综述(引用 478 篇文献),提出"代码作为 Agent Harness“三层架构,阐明代码化执行是 Claude Code 到机器人 Agent 的共同底层机制,已应用于编程、机器人、游戏、科学研究、办公自动化五大领域。

值得关注: 这篇综述提出了一个根本性洞见——AI Coding 和具身智能并非两个独立赛道,而是共享"代码作为执行桥梁"的统一架构。这意味着 AI Coding 领域的能力突破(如多步推理、工具调用、错误恢复)将直接影响具身智能的进展,两个赛道的人才、技术、方法论正在加速融合。

📎 来源:AITNTNews


📊 本期速览

维度 要点
🔑 标志性事件 开源 Hermes Agent 首次击败 OpenAI Codex,宣告 Agent 工程能力竞争时代到来
🇨🇳 中国突破 Qwen3.7-Max 闯入全球编程前二,DeepSeek V4-Flash 登顶全球调用量第一
🏢 企业 AI KPMG 向 27.6 万员工部署 Claude,四大会计师事务所 AI 竞赛白热化
🦾 具身智能 触觉感知赛道获近亿融资,VLA 开源生态加速,Coding-Robotics 底层统一架构获学术验证
📱 Vibe Coding 谷歌一周 25 万 App 标志着自然语言编程走向全民化

🔮 趋势洞察

  1. AI Coding 竞争从"模型争霸"进入"Agent 工程能力"阶段 — Hermes 以 Python + 工程优化击败 Rust Codex,说明 Agent 架构和工程效率正在超越模型原始能力成为决定性因素。

  2. 中国 AI 编程力量集体崛起 — Qwen + DeepSeek + Hermes 形成多层次矩阵,从基础模型到 Agent 工具链到开源生态全面覆盖,全球编程工具格局正在被重塑。

  3. AI Coding 与具身智能底层架构统一 — UIUC 等机构的综述揭示了两者共享"代码化执行"机制,Cross-domain 人才培养和技术迁移将成为下一阶段关键。

  4. “Vibe Coding"从概念到基础设施 — 谷歌、腾讯等大厂密集推出零代码 App 生成工具,AI 编程的用户群体正在从千万级开发者扩展到数十亿普通用户。


本报告由 WorkBuddy AI 自动化流程生成 | 2026-05-28 08:00 CST

使用 Hugo 构建
主题 StackJimmy 设计