AI 日报 — 2026 年 6 月 16 日

聚焦：AI Coding × 具身智能
筛选 8 条核心动态，覆盖推理加速、Agent 工程化、企业 AI 收购、车企跨界具身智能、世界模型突破等关键议题。

🤖 AI Coding

1. Kimi K2.7 Code 高速版上线：输出提速 6 倍，达 260 tokens/s

月之暗面正式上线 Kimi K2.7 Code 高速版，与普通版为同一模型但输出速度约 5-6 倍，常规编程场景约 180 Token/s，短上下文可达 260 Token/s。API 定价为普通版 2 倍，模型 ID：kimi-k2.7-code-highspeed。Kimi Code Plan 用户可通过「抢先体验计划」使用。相比 K2.6，K2.7 Code 在长上下文编程指令遵循、长程任务性能均有提升，平均 token 消耗减少 30%。庆祝发布同步推出三周充赠活动。

关注原因：AI 编程推理速度军备竞赛持续升级。从 Kimi K2.7 高速版（260 t/s）到小米 UltraSpeed（1000 t/s）、DFlash（4.3x 吞吐），速度正成为 AI Coding 工具的核心竞争维度。更快的响应 = 更流畅的 Agent 工作流。

🔗 月之暗面公众号

2. DFlash + Spec V2：下一代投机解码，吞吐量提升 4.3 倍

Z Lab、Modal 与 SGLang 团队联合发布 DFlash 投机解码模型和 SGLang 默认 Spec V2 引擎。DFlash 采用块扩散 + KV 注入并行生成整块 draft token，在 Qwen 3.5 397B-A17B（BF16）的 HumanEval 数据集上，并发 1 时吞吐量达到基线的 4.3 倍。该技术从根本上降低了大模型推理延迟。

关注原因：投机解码是底层推理优化的前沿方向，直接影响所有 AI Coding 工具的响应速度和成本。LMSYS 团队出品、与 SGLang 深度集成，有望成为开源推理栈的标配组件。

🔗 LMSYS Blog

3. Claude Code v2.1.178 发布：参数级权限控制 + 嵌套 Skills 自动加载

Claude Code 发布 v2.1.178 版本，核心更新包括：

Tool(param:value) 语法：权限规则现在可以匹配工具输入参数，实现细粒度访问控制
嵌套 Skills 自动加载：子目录 skills/ 中的技能自动发现，名称冲突时以 <dir>:<name> 形式保留
子 Agent 分类器改进：自动模式下生成子 Agent 前增加分类器评估
Bug 报告流程优化：/bug 提交前需填写描述

关注原因：参数级权限控制将 Agent 安全治理从"工具级别"细化到"参数级别"，是企业级 Agent 部署的关键基础设施。嵌套 Skills 自动加载降低了多项目 Skills 管理复杂度。

🔗 Claude Code Releases

4. Grok Build 推出 Agent Dashboard：多编码会话统一管理

xAI 为 Grok Build 推出 Agent Dashboard，提供单一屏幕管理多个编码会话。仪表板按状态分组（等待输入、工作中、空闲），支持 peek 面板查看最新输出、多会话并行回复、新会话分派时设置模型和权限模式。可通过 grok dashboard、/dashboard 或 Ctrl+\ 打开，关闭后会话继续运行。同时宣布 Grok 与 Warp 终端集成，grok-build-0.1 模型嵌入 Warp，近百万开发者可直接在终端中使用。

关注原因：从"单 Agent 编码"到"多 Agent 编排管理"是 AI Coding 工具进化的明确方向。Grok Build Dashboard 和 Warp 集成标志着 Grok 从模型能力向开发者工作流全栈渗透。

🔗 xAI News | Grok × Warp

5. Salesforce 以 36 亿美元收购 AI 客服平台 Fin（前 Intercom）

Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin（前身为 Intercom）。Fin 提供可跨实时聊天、WhatsApp、短信、电话、Slack 等多渠道解决客户问题的 AI 智能体，利用开源模型实现高性价比。Salesforce 计划将 Fin 的技术和团队整合进其企业级 Agentforce 平台，交易预计 2027 年初完成。

关注原因：2026 年迄今最大规模的 AI 应用并购案。Tomer Tunguz 将此与 Fable 被禁、Nadella 护城河论点并列为"AI 应用黄金时代"三大信号。开源模型驱动的 Fin 证明：AI 应用层企业可以用远低于自研大模型的成本构建产品壁垒。

🔗 TechCrunch | Tomer Tunguz 分析

🦾 具身智能

6. 赛力斯人形机器人"小赛"首次亮相，已投入实际运营

6 月 15 日，赛力斯集团董事、副总裁康波发布视频，正式公开首款人形机器人 “小赛”。机器人在赛力斯超级工厂亮相，由演员黄渤现场体验。视频显示"小赛"已投入实际运营，覆盖 B 端工业制造与 C 端服务接待等多维度场景。赛力斯确认今年内将推出包括双足、四足、轮式在内的多款具身智能机器人，并推进汽车向 L4+ 具身智能方向演进。

关注原因：继比亚迪"尧舜禹"（计划内部部署 2 万台）后，赛力斯成为又一家公开跨界具身智能的主流车企。车企凭借制造供应链、成本控制和场景理解三重优势，正在成为具身智能产业化的核心推动力。“已投入实际运营"这一表述表明赛力斯的进度超出外界预期。

🔗 新浪科技

7. ACE ROBOTICS Kairos 世界模型登顶 4 项全球具身智能基准

ACE ROBOTICS（商汤科技孵化）宣布其开源世界模型 Kairos 在四大具身智能基准测试公开排行榜上排名第一：

基准	成绩	超越
LIBERO-Plus（场景泛化）	89.0	ACoT-VLA (88.0)、Pi 0.5 (85.7)
WorldModelBench（物理建模）	9.30（4B）	Lingbot (28B)、Cosmos 3 (16B)
DreamGen（合成数据迁移）	0.618	全球领先
RoboTwin 2.0（双臂操作）	96.1%	MotuBrain (96.0)

Kairos 采用原生统一的"多模态理解-生成-预测"架构，仅 4B 参数便在多个基准上击败 28B 的 VLA 模型。上半年完成数亿美元融资（吉利资本、达晨财智、深创投等参投）。

关注原因：世界模型路线在具身智能领域取得对传统 VLA 方案的关键突破。4B 模型击败 28B 展示了世界模型架构在参数效率上的巨大优势。这是继 NVIDIA Cosmos 3 之后，又一家顶级机构验证了"统一世界模型"路线的可行性。

🔗 IT News Online

8. MiniMax M3 全量开源：Code Arena WebDev 跻身帕累托最优

MiniMax 上周五开源 428B 总参数 / 23B 激活参数的 M3 模型权重及 MSA 稀疏注意力技术论文。发布两周后，M3 在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均获开源模型第一，Code Arena WebDev 跻身帕累托最优序列。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型。输出速度已从约 30 TPS 提升至约 80 TPS，计划再提速 30-40%。

关注原因：虽然 M3 不是纯粹的 Coding 模型，但其 Code Arena WebDev 帕累托最优评价表明：通用多模态模型在编程能力上已可与专用模型抗衡。开源权重 + MSA 稀疏注意力技术为社区提供了低成本复现路径。

🔗 MiniMax 公众号

📊 趋势速览

推理速度成为 AI Coding 核心战场：Kimi K2.7 高速版（260 t/s）+ DFlash 4.3x + 小米 UltraSpeed（1000 t/s）三连击，速度经济性决定 Agent 可用性
Agent 工程化从"能写码"到"能管理”：Claude Code 参数级权限 + Grok Dashboard 多会话管理，Agent 治理基础设施快速成型
AI 应用进入"黄金时代"：Fable 被禁 + Nadella 护城河论点 + Salesforce 收购 Fin，三大信号宣告 AI 价值重心从模型层向应用层转移
车企跨界具身智能加速：比亚迪"尧舜禹"→赛力斯"小赛"，汽车制造的供应链和场景优势正在转化为具身智能产业化动力
世界模型路线崛起：Kairos 4B 击败 VLA 28B，统一架构的参数效率和泛化能力获得实证，具身智能技术路线竞争进入新阶段
开源模型代码能力追平闭源：M3 Code Arena 帕累托最优 + Kairos 开源，开放生态正在缩小与闭源系统的差距

数据来源：AI HOT (aihot.virxact.com)、新浪科技、TechCrunch、xAI、LMSYS、Anthropic、IT News Online 等
生成时间：2026-06-16 08:45 CST