AI 日报 — 2026 年 6 月 16 日
聚焦:AI Coding × 具身智能
筛选 8 条核心动态,覆盖推理加速、Agent 工程化、企业 AI 收购、车企跨界具身智能、世界模型突破等关键议题。
🤖 AI Coding
1. Kimi K2.7 Code 高速版上线:输出提速 6 倍,达 260 tokens/s
月之暗面正式上线 Kimi K2.7 Code 高速版,与普通版为同一模型但输出速度约 5-6 倍,常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍,模型 ID:kimi-k2.7-code-highspeed。Kimi Code Plan 用户可通过「抢先体验计划」使用。相比 K2.6,K2.7 Code 在长上下文编程指令遵循、长程任务性能均有提升,平均 token 消耗减少 30%。庆祝发布同步推出三周充赠活动。
关注原因:AI 编程推理速度军备竞赛持续升级。从 Kimi K2.7 高速版(260 t/s)到小米 UltraSpeed(1000 t/s)、DFlash(4.3x 吞吐),速度正成为 AI Coding 工具的核心竞争维度。更快的响应 = 更流畅的 Agent 工作流。
🔗 月之暗面公众号
2. DFlash + Spec V2:下一代投机解码,吞吐量提升 4.3 倍
Z Lab、Modal 与 SGLang 团队联合发布 DFlash 投机解码模型和 SGLang 默认 Spec V2 引擎。DFlash 采用块扩散 + KV 注入并行生成整块 draft token,在 Qwen 3.5 397B-A17B(BF16)的 HumanEval 数据集上,并发 1 时吞吐量达到基线的 4.3 倍。该技术从根本上降低了大模型推理延迟。
关注原因:投机解码是底层推理优化的前沿方向,直接影响所有 AI Coding 工具的响应速度和成本。LMSYS 团队出品、与 SGLang 深度集成,有望成为开源推理栈的标配组件。
3. Claude Code v2.1.178 发布:参数级权限控制 + 嵌套 Skills 自动加载
Claude Code 发布 v2.1.178 版本,核心更新包括:
Tool(param:value)语法:权限规则现在可以匹配工具输入参数,实现细粒度访问控制- 嵌套 Skills 自动加载:子目录
skills/中的技能自动发现,名称冲突时以<dir>:<name>形式保留 - 子 Agent 分类器改进:自动模式下生成子 Agent 前增加分类器评估
- Bug 报告流程优化:
/bug提交前需填写描述
关注原因:参数级权限控制将 Agent 安全治理从"工具级别"细化到"参数级别",是企业级 Agent 部署的关键基础设施。嵌套 Skills 自动加载降低了多项目 Skills 管理复杂度。
4. Grok Build 推出 Agent Dashboard:多编码会话统一管理
xAI 为 Grok Build 推出 Agent Dashboard,提供单一屏幕管理多个编码会话。仪表板按状态分组(等待输入、工作中、空闲),支持 peek 面板查看最新输出、多会话并行回复、新会话分派时设置模型和权限模式。可通过 grok dashboard、/dashboard 或 Ctrl+\ 打开,关闭后会话继续运行。同时宣布 Grok 与 Warp 终端集成,grok-build-0.1 模型嵌入 Warp,近百万开发者可直接在终端中使用。
关注原因:从"单 Agent 编码"到"多 Agent 编排管理"是 AI Coding 工具进化的明确方向。Grok Build Dashboard 和 Warp 集成标志着 Grok 从模型能力向开发者工作流全栈渗透。
🔗 xAI News | Grok × Warp
5. Salesforce 以 36 亿美元收购 AI 客服平台 Fin(前 Intercom)
Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin(前身为 Intercom)。Fin 提供可跨实时聊天、WhatsApp、短信、电话、Slack 等多渠道解决客户问题的 AI 智能体,利用开源模型实现高性价比。Salesforce 计划将 Fin 的技术和团队整合进其企业级 Agentforce 平台,交易预计 2027 年初完成。
关注原因:2026 年迄今最大规模的 AI 应用并购案。Tomer Tunguz 将此与 Fable 被禁、Nadella 护城河论点并列为"AI 应用黄金时代"三大信号。开源模型驱动的 Fin 证明:AI 应用层企业可以用远低于自研大模型的成本构建产品壁垒。
🔗 TechCrunch | Tomer Tunguz 分析
🦾 具身智能
6. 赛力斯人形机器人"小赛"首次亮相,已投入实际运营
6 月 15 日,赛力斯集团董事、副总裁康波发布视频,正式公开首款人形机器人 “小赛”。机器人在赛力斯超级工厂亮相,由演员黄渤现场体验。视频显示"小赛"已投入实际运营,覆盖 B 端工业制造与 C 端服务接待等多维度场景。赛力斯确认今年内将推出包括双足、四足、轮式在内的多款具身智能机器人,并推进汽车向 L4+ 具身智能方向演进。
关注原因:继比亚迪"尧舜禹"(计划内部部署 2 万台)后,赛力斯成为又一家公开跨界具身智能的主流车企。车企凭借制造供应链、成本控制和场景理解三重优势,正在成为具身智能产业化的核心推动力。“已投入实际运营"这一表述表明赛力斯的进度超出外界预期。
🔗 新浪科技
7. ACE ROBOTICS Kairos 世界模型登顶 4 项全球具身智能基准
ACE ROBOTICS(商汤科技孵化)宣布其开源世界模型 Kairos 在四大具身智能基准测试公开排行榜上排名第一:
| 基准 | 成绩 | 超越 |
|---|---|---|
| LIBERO-Plus(场景泛化) | 89.0 | ACoT-VLA (88.0)、Pi 0.5 (85.7) |
| WorldModelBench(物理建模) | 9.30(4B) | Lingbot (28B)、Cosmos 3 (16B) |
| DreamGen(合成数据迁移) | 0.618 | 全球领先 |
| RoboTwin 2.0(双臂操作) | 96.1% | MotuBrain (96.0) |
Kairos 采用原生统一的"多模态理解-生成-预测"架构,仅 4B 参数便在多个基准上击败 28B 的 VLA 模型。上半年完成数亿美元融资(吉利资本、达晨财智、深创投等参投)。
关注原因:世界模型路线在具身智能领域取得对传统 VLA 方案的关键突破。4B 模型击败 28B 展示了世界模型架构在参数效率上的巨大优势。这是继 NVIDIA Cosmos 3 之后,又一家顶级机构验证了"统一世界模型"路线的可行性。
8. MiniMax M3 全量开源:Code Arena WebDev 跻身帕累托最优
MiniMax 上周五开源 428B 总参数 / 23B 激活参数的 M3 模型权重及 MSA 稀疏注意力技术论文。发布两周后,M3 在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均获开源模型第一,Code Arena WebDev 跻身帕累托最优序列。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型。输出速度已从约 30 TPS 提升至约 80 TPS,计划再提速 30-40%。
关注原因:虽然 M3 不是纯粹的 Coding 模型,但其 Code Arena WebDev 帕累托最优评价表明:通用多模态模型在编程能力上已可与专用模型抗衡。开源权重 + MSA 稀疏注意力技术为社区提供了低成本复现路径。
📊 趋势速览
- 推理速度成为 AI Coding 核心战场:Kimi K2.7 高速版(260 t/s)+ DFlash 4.3x + 小米 UltraSpeed(1000 t/s)三连击,速度经济性决定 Agent 可用性
- Agent 工程化从"能写码"到"能管理”:Claude Code 参数级权限 + Grok Dashboard 多会话管理,Agent 治理基础设施快速成型
- AI 应用进入"黄金时代":Fable 被禁 + Nadella 护城河论点 + Salesforce 收购 Fin,三大信号宣告 AI 价值重心从模型层向应用层转移
- 车企跨界具身智能加速:比亚迪"尧舜禹"→赛力斯"小赛",汽车制造的供应链和场景优势正在转化为具身智能产业化动力
- 世界模型路线崛起:Kairos 4B 击败 VLA 28B,统一架构的参数效率和泛化能力获得实证,具身智能技术路线竞争进入新阶段
- 开源模型代码能力追平闭源:M3 Code Arena 帕累托最优 + Kairos 开源,开放生态正在缩小与闭源系统的差距
数据来源:AI HOT (aihot.virxact.com)、新浪科技、TechCrunch、xAI、LMSYS、Anthropic、IT News Online 等
生成时间:2026-06-16 08:45 CST