AI 早报 2026-05-07

视频版哔哩哔哩YouTube

概览

要闻

  • Anthropic 与 SpaceX 合作新增 300MW 算力,放宽使用限制 #1

模型发布

  • 豆包 Doubao-Seed-2.0-lite 模型升级支持全模态 #2
  • Zyphra发布ZAYA1-8B,AMD平台训练开源 #3

开发生态

  • Claude Managed Agents 上线 dreaming 与 outcomes 等功能 #4
  • Cursor 发布 3.3 版,新增上下文占用明细及 CI 自动修复 #5
  • TRAE 宣布三端同步全量免费开放 #6
  • OpenClaw 发布 2026.5.5 及 5.6,新增功能并修复问题 #7
  • Warp 团队开源 oz-skills 集合,包含 15 个内部工作流技能 #8

产品应用

  • 谷歌更新搜索中AI Mode与AI Overviews,优化链接展示与排序 #9
  • Manus 升级 Projects 功能,支持从任务中自动学习复用模式 #10

技术与洞察

  • Unsloth AI 联合 NVIDIA 优化,大模型训练速度提升约 25% #11
  • OpenAI 联合英伟达等开源 MRC 网络协议服务 AI 训练 #12

行业动态

  • Fenris Creations 宣布独立并联手 DeepMind 启动 AI Agent 研究 #13
  • 谷歌 Flow Music 联手 Believe,向艺人开放 AI 音乐生成工具 #14
  • WorldClaw 联合特朗普家族 WLFI 平台推出 WorldRouter #15

前瞻与传闻

  • 月之暗面传将获 20 亿美元融资,估值超 200 亿美元 #16

Anthropic 与 SpaceX 合作新增 300MW 算力,放宽使用限制 #1

Anthropic宣布与SpaceX达成合作,获得Colossus 1数据中心全部超过300兆瓦的算力。

基于此及近期其他算力交易,Anthropic即日上调使用限额:Claude Code的五小时滚动速率限制翻倍。

同时移除ProMax方案在高峰时段的限额缩减。APIOpus模型速率限制也得到大幅提升。

值得注意的是,每周总体限额并未提升。

Anthropic 近期宣布与 SpaceX 达成一项算力合作,该合作使其获得 SpaceX 旗下 Colossus 1 数据中心全部超过 300 兆瓦(逾 22 万张 NVIDIA GPU)的算力,并计划于本月内部署上线。

基于此项合作以及近期其他算力交易,该公司即日生效上调了 Claude 的使用限额:将 ProMaxTeam 及按席位计费的 Enterprise 方案的 Claude Code 五小时滚动速率限制翻倍;取消 ProMax 方案的高峰时段限额缩减;大幅提升 APIOpus 系列模型的速率限制。

根据官方及多方信息,Colossus 1 原为 xAI 用于训练 Grok 的超级计算机,随着 SpaceX 此前对 xAI 的收购以及 xAI 将训练重心转移至 Colossus 2,该设施得以整体租赁给 Anthropic 以支持 Claude 的运行。

此外,双方均表示有兴趣合作开发数吉瓦级别的轨道 AI 算力。

相关链接:


豆包 Doubao-Seed-2.0-lite 模型升级支持全模态 #2

字节火山宣布Doubao-Seed-2.0-lite完成重大升级,成为豆包首款全模态理解模型。该模型支持视、图、音、文统一理解与跨模态推理,Agent、Coding与GUI能力增强,可闭环执行界面操作。

其视觉在物理、医疗推理上超越前代pro版,部分领域达SOTA;音频支持19语种转写互译。

该模型已在火山方舟上线。此外,Doubao-Seed-2.0-mini同步上线,同样支持全模态。

字节跳动 火山引擎宣布Doubao-Seed-2.0-lite模型完成重大版本升级。作为豆包大模型家族首款全模态理解模型,它已支持视频、图像、音频、文本的原生统一理解与跨模态联合推理。

同时,其AgentCodingGUI能力获得全面增强。该模型的视觉理解在物理及医疗等高阶学科推理上表现大幅超越前代版本Doubao-Seed-2.0-pro。在细粒度感知与具身理解等关键领域,它已达到SOTA水平。

音频能力方面,它支持19个语种的精准语音转写与多语种互译,并能深度捕捉情绪、环境声等细节。在多项公开基准评测中,其表现优于Gemini-3.1-Pro

目前,该模型现已在火山方舟平台上线。此外,能力同步升级的Doubao-Seed-2.0-mini也已上线,同样支持全模态理解且Tokens效率较上代更高。

相关链接:


Zyphra发布ZAYA1-8B,AMD平台训练开源 #3

Zyphra发布了总参数8.4B、活跃参数760MMoE语言模型ZAYA1-8B

该模型完全在AMD集群上训练,在数学与编程推理任务上击败了部分大型模型。

Zyphra 发布开源 MoE 模型 ZAYA1-8B。该模型拥有 760M 活跃参数与 8.4B 总参数。

其完全在 AMD MI300X 集群端到端训练,专注数学与代码推理。模型引入 CCA 等创新架构及多阶段后训练。

配合 Markovian RSA 测试时计算法,在额外高算力下,其于 APEX-shortlist 超越 DeepSeek-V3.2 等大模型。

模型已依 Apache 2.0 开源。

相关链接:


Claude Managed Agents 上线 dreaming 与 outcomes 等功能 #4

AnthropicClaude Managed Agents推出预览版dreaming与测试版outcomes等功能。

其中,dreaming可自动优化记忆实现 Agent 自我改进。

outcomes 可通过独立评分提升输出质量。

近日,AnthropicClaude Managed Agents 推出多项升级:发布研究预览版 dreaming 及公开测试版的 outcomes、多 Agent 编排与 webhooks。

dreaming 可回顾历史提取模式优化记忆,实现跨会话自我改进。

outcomes 引入基于评分的自我校正机制,指导 Agent 迭代。

多 Agent 编排支持将复杂任务拆分给子 Agent 并行处理。

相关链接:


Cursor 发布 3.3 版,新增上下文占用明细及 CI 自动修复 #5

Cursor 发布了 3.3 版本。开发者现在能直观查看上下文中 rulesskills 等内容的占用明细来优化配置。

该版本还能设置常驻 Agent 自动对 CI 失败提交修复。

近日,Cursor在其IDE的3.3版本中为Agent新增了上下文占用细目查看功能,同时上线了CI失败自动修复能力。

根据官方发布的信息,开发者可以直观查看Agent在rules、skills、MCPs及subagents等模块上的上下文占用明细。用户可以利用这些统计数据诊断问题、优化配置。

用户还可设置始终在线的Agent监控GitHub仓库。这些Agent能自动调查CI失败根因并提交包含修复的Pull Request。

相关链接:


TRAE 宣布三端同步全量免费开放 #6

TRAE宣布 SOLO三端同步全量开放。

该产品支持通过移动端语音跨设备远程调度Agent任务,三端均可语音交互生成会议纪要。

桌面端与网页端新增飞书接入与定时任务功能。

TRAE 正式宣布移动端、网页端与新增 Windows 版的桌面端同步全量开放,三端中国区均免费提供服务。

该产品内置双模式智能体,移动端支持语音、文本及文件输入,可连接云端与多台 PC 实现跨设备远程任务调度。多端任务状态实时同步,单账号最多允许 10 台设备同时在线。

此次更新中,三端均支持与 AI 语音交互并自动生成结构化会议纪要。桌面端与网页端新增飞书 CLI 接入能力及定时任务功能。用户可通过应用商店或官网获取体验。

相关链接:


OpenClaw 发布 2026.5.5 及 5.6,新增功能并修复问题 #7

OpenClaw项目发布 2026.5.52026.5.6两版更新。

2026.5.5版修复了多平台频道与插件更新的稳定性问题。

2026.5.6版则紧急修正了系列 Bug 与报错。

OpenClaw 近期发布 2026.5.52026.5.6 版本。

据官方消息,2026.5.5 版重点修复即时通讯频道、控制界面、插件更新及网关诊断的稳定性问题。

随后紧急发布的 2026.5.6 版用于修复上个版本缺陷。

相关链接:


Warp 团队开源 oz-skills 集合,包含 15 个内部工作流技能 #8

Warp团队开源了包含 15 个组件的 Agent Skills 合集 oz-skills,涵盖 Git 协作与 Web 审计等五大场景。

开发者可通过执行 npx 指令快速安装。

近日,Warp 团队正式将其内部用于加速工作流的 Agent Skills 集合"oz-skills"开源。

项目已在 GitHub 发布并遵循 MIT 协议。该集合包含 15 个可复用 Skills,覆盖 Git/GitHub 协作、数据分析、Web 质量审计、基础设施工程规范及通用生产力五类场景。

所有 Skills 均为包含 YAML 前置元数据的 Markdown 文件,遵循 Agent Skills 规范。

相关链接:


谷歌更新搜索中AI Mode与AI Overviews,优化链接展示与排序 #9

Google 更新了搜索中的 AI ModeAI Overviews,带来五项功能:AI 回答末尾提供延伸阅读建议;高亮展示用户订阅的新闻链接;引入社区观点预览;在正文旁直接嵌入相关链接;桌面端新增悬停链接预览。

近日,Google更新了Search中的AI ModeAI Overviews,助用户发掘网站及原创内容。

据官方博客,此次更新包含五项功能:一是在AI回答末尾提供延伸阅读建议;二是推出新闻订阅集成,高亮已订阅媒体链接。官方早期测试显示其点击率显著提升。

三是引入社区观点预览,提取公开讨论引述并附上下文。四是于AI回答正文要点旁直接嵌入链接。五是桌面端新增悬停预览功能,显示目标网站信息。

团队正运用query fan-out等技术持续优化链接展示与排序。

相关链接:


Manus 升级 Projects 功能,支持从任务中自动学习复用模式 #10

Manus为其 Projects 功能上线“从每个任务学习”能力。

该能力能自动识别任务中的可复用指令、文件与工作流。

经用户审查批准后,将更新项目上下文。

ManusProjects功能推出“从每个任务学习”新能力,允许Project在每次任务对话后自动识别可复用的指令、文件、术语或工作流模式

并在用户审查批准后更新项目上下文。用户可通过提示词手动触发审查,或将其嵌入重复性工作流的节奏中。

经授权后方可生效的更新涵盖指令文件技能。旨在让Projects随时间推移愈发有用,减少每次任务重复设置的成本。使后续任务能基于团队已学到的共识启动。

相关链接:


Unsloth AI 联合 NVIDIA 优化,大模型训练速度提升约 25% #11

Unsloth AINVIDIA联合发布技术指南,通过引入“打包序列元数据缓存”、“双缓冲检查点重载”以及"MoE 路由优化”三项技术,在 B200 显卡上将大语言模型训练速度提升约 25%

Unsloth AI近日与NVIDIA联合发布技术指南,通过三项关键优化将 LLM 训练速度提升约 25%

这三项优化主要消除隐性开销中的重复工作与串行等待。

一是打包序列元数据缓存,在 Qwen3-14B 任务中使批次整体提升 14.3%

二是双缓冲检查点重载,使激活值拷贝与计算并行,在基于 B2008B32B 模型上带来 4.6%8.4% 的吞吐提升。

三是 MoE 路由优化,用一次性分组替代动态查询,实现 10%15% 的整体提速。

目前相关代码已在 GitHub 开源。

相关链接:


OpenAI 联合英伟达等开源 MRC 网络协议服务 AI 训练 #12

OpenAI联合AMD英伟达等公司,通过开放计算项目正式开源了一种名为MRC的新型网络协议。

这个协议专为大规模AI训练设计,能解决同步训练时GPU数据传输的拥塞和故障问题。目前已在Stargate等项目中部署。

OpenAI联合AMDBroadcomIntelMicrosoftNVIDIA通过OCP正式开源新型网络协议MRC

该协议将数据包喷洒至多路径并结合SRv6源路由,将网络架构从3-4 层交换机简化为2 层。仅2 层交换机即可连接约13.1 万张****GPU,降低了功耗与成本,并能微秒级绕过故障。

MRC已部署于OpenAI所有最大GB200超算系统,用于训练前沿模型。官方指出,面对频繁链路抖动甚至重启4 台核心交换机,MRC均未对训练任务产生可测量影响。

相关链接:


Fenris Creations 宣布独立并联手 DeepMind 启动 AI Agent 研究 #13

运营 EVE OnlineCCP Games 正式更名为 Fenris Creations,并与 Google DeepMind 达成合作。

双方将把该游戏作为安全沙盒,在受控离线环境中探索 AI Agent 的记忆、持续学习与长期规划能力。

运营 《EVE Online》CCP Games 宣布更名为 Fenris Creations,结束与 Pearl Abyss 的八年隶属关系。

此外,Fenris CreationsGoogle DeepMind 达成研究合作,共同在 EVE Online 这一由复杂经济、政治与玩家冲突驱动的宇宙中探索 Agent 的记忆、持续学习与长期规划能力。

官方称,初始研究将在受控离线版本中进行,不与游戏实时服务器 Tranquility 相连。

Google DeepMind 总监 Alexandre MoufarekEVE 称为测试通用人工智能的“独一无二的安全沙盒”,并期待借此拓展 AI 前沿与玩家体验。

更多细节将在即将举办的 Fanfest 2026 上披露。

相关链接:


谷歌 Flow Music 联手 Believe,向艺人开放 AI 音乐生成工具 #14

Google宣布与 Believe 达成合作,向其旗下艺人提供 AI音乐生成工具Flow Music

在此合作中,谷歌不主张对生成内容拥有所有权。

近日,Google宣布旗下 AI 音乐工具 Flow Music及底层模型Lyria 3 ProBelieve达成合作,向BelieveTuneCore 旗下艺人、制作人和词曲作者开放使用。

Google明确声明,不主张对该工具生成的原创内容拥有所有权。

此外,BelieveTuneCore 将挑选部分艺人与制作人,每周与Google团队会面反馈,以促进该工具未来发展。

相关链接:


WorldClaw 联合特朗普家族 WLFI 平台推出 WorldRouter #15

近日,WorldClaw特朗普家族创立的加密项目WLFI联合推出模型路由平台WorldRouter

用户凭单账户可调用超300AI模型。

目前,社区对该平台折扣真实性及相关机制存在诸多质疑。

WorldClaw近日与加密货币项目 WLFI联合推出AI模型路由平台WorldRouter。用户通过单一账户即可调用300余款AI模型,费用据称比模型官方定价及OpenRouter低约30%

该平台后续还规划了WorldAgent运行时与预装操作系统的本地AI硬件。WLFI特朗普的三个儿子等人创立,特朗普曾列为荣誉联合创始人,其家族可从销售中获得**75%**净收益。

平台现已上线官网,但社区对其折扣真实性、代币锁仓机制与持久性存在诸多质疑。

相关链接:


月之暗面传将获 20 亿美元融资,估值超 200 亿美元 #16

据报道,Kimi 即将完成 20 亿美元 新一轮融资。

投后估值突破 200 亿美元,且该公司 ARR 已突破 2 亿美元

据《晚点 LatePost》消息,Kimi月之暗面)即将完成新一轮 20 亿美元融资,投后估值突破 200 亿美元

该轮融资由美团龙珠领投,中国移动CPE(源峰资本)等参投,其中仅龙珠就出手超 2 亿美元

美团龙珠合伙人王新宇透露,在K2.5模型更新后,Kimi ARR于今年 3 月突破 1 亿美元,并于 4 月增长至超 2 亿美元

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误