2026-06-02

AI 早报 2026-06-02
概览
要闻
- 千问发布多模态智能体模型 Qwen3.7-Plus ↗
#1 - MiniMax Token Plan 切换至 Token 计费并补偿老用户 ↗
#2 - Claude 修复 Opus 4.8 并行调用异常并重置用户限额 ↗
#3
模型发布
- MiniMax 发布模型 M3 并计划未来 10 天内开源权重 ↗
#4 - VAST 发布 Project Eden 世界模型研究预览版 ↗
#5 - JetBrains 发布 12B 参数 MoE 架构模型 Mellum2 ↗
#6
开发生态
- Qoder多款产品开放Qwen3.7-Max每日200次免费调用 ↗
#7 - Agnes AI宣布全模态模型API无限期免费开放 ↗
#8 - SpaceXAI 在 Grok Build 中上线 Cursor 的 Composer 2.5 模型 ↗
#9 - Cursor 推出 Premium 团队席位并提升 Teams 用量额度 ↗
#10 - MiniMax Code 桌面端上线,支持多阶段任务自主运行 ↗
#11 - google-gemma 团队发布 Gemma skills 开源项目 ↗
#12 - OpenAI 推出 Codex Python SDK 供开发者集成 ↗
#13 - Hermes Agent 原生登陆 Windows,无需 WSL 即可运行 ↗
#14 - Google AI Studio 支持直连 Gmail 等多项服务 ↗
#15
产品应用
技术与洞察
- Perplexity推出Search as Code搜索架构并上线Agent API ↗
#18
行业动态
- Anthropic向美国SEC机密提交S-1草案以筹备潜在IPO ↗
#19 - Alphabet 计划通过股权发行筹资 800 亿美元用于 AI 建设 ↗
#20 - 智谱拟申请科创板上市,发行全部为新股 ↗
#21 - OpenAI多款模型及Agent登陆Amazon Bedrock ↗
#22 - Intel 发布 Crescent Island GPU,最高配备 480GB 显存 ↗
#23 - 报道称佛罗里达州起诉 OpenAI 及 CEO 指控其无视安全警告 ↗
#24
前瞻与传闻
GTC Taipei
- NVIDIA 发布 Cosmos 3 开源物理 AI 全模态模型 ↗
#27 - NVIDIA 宣布将于本周发布 Nemotron 3 Ultra 模型 ↗
#28 - NVIDIA 发布 Vera CPU 与 DSX 平台赋能 Agentic AI 工厂 ↗
#29 - NVIDIA 发布 RTX Spark 超级芯片进军 Windows AI PC 市场 ↗
#30 - NVIDIA 推出 Alpamayo 2 Super 及 AlpaGym 闭环训练框架 ↗
#31 - NVIDIA扩大DRIVE Hyperion生态,联手车企与Uber推进L4自动驾驶 ↗
#32 - NVIDIA 发布首个开源人形机器人参考设计 Isaac GR00T ↗
#33 - NVIDIA 发布企业与 Physical AI 开源 Agent 工具包 ↗
#34
千问发布多模态智能体模型 Qwen3.7-Plus #1
阿里
Qwen正式发布了多模态模型Qwen3.7-Plus。该模型统一视觉与语言能力,能操作图形和命令行界面,并具备完整的Agent能力。现已通过 阿里云百炼 提供API,并可在 Qwen Studio 中体验。
阿里巴巴 Qwen 团队正式发布多模态智能体模型 Qwen3.7-Plus,在 Qwen3.7 文本与 Agent 能力基础上全面升级视觉-语言能力,打造一体化智能体基座。
该模型作为多模态交互混合智能体,能感知真实场景、操作图形界面、基于视觉参考生成代码,并在单一智能体循环中融合 GUI 与 CLI 交互完成端到端任务。
Qwen3.7-Plus 现已通过阿里云百炼提供 API 服务,并可在 Qwen Studio 中体验。

相关链接:
MiniMax Token Plan 切换至 Token 计费并补偿老用户 #2
MiniMax 因
M3模型上线,已将 Token Plan 切换为 Token-Based 计费,并为不同时段订购的老用户推出权益补偿,包括无周限额保留和M3额度加赠;线上退款通道预计 6 月 2 日 开放。
MiniMax 开放平台宣布,为配合全新多模态模型 M3 的上线,其 Token Plan 订阅服务已切换为 Token-Based 计费。
平台针对老用户推出分层权益补偿:3月22日前购买且无周限额的用户升级后保持无周限额。
3月22日至6月5日上午10点前订阅的用户,M3 周限额永久加赠 50%。
所有订阅用户在6月1日至7日可享5小时周额度翻倍,补偿积分有效期也自动延长至一年。
此次迁移中,Plus/Max 档价格不变、次数增加,停售档月费下调并每月补发积分,新增 Ultra 重度档。
线上自助退款通道预计于6月2日上线。

相关链接:
Claude 修复 Opus 4.8 并行调用异常并重置用户限额 #3
ClaudeDevs 宣布为所有 Pro 和 Max 计划用户重置 5 小时及周限额,并修复了
Claude Code中因Opus 4.8请求处理异常导致额度被过快消耗的缺陷。
ClaudeDevs 宣布已为所有 Pro 和 Max 计划用户重置了 5 小时 使用限额与周限额。
官方确认此前存在一个影响 Claude Code 会话的缺陷,该缺陷导致部分会话生成过多的并行子 Agent,使额度消耗快于预期。
ClaudeDevs 进一步说明,此问题源于 Opus 4.8 请求的处理方式异常,导致模型触发了超出预期的并行工具调用。
该问题与动态工作流无关。

相关链接:
MiniMax 发布模型 M3 并计划未来 10 天内开源权重 #4
MiniMax正式发布原生多模态模型
M3,采用全新MSA架构,最高支持1M超长上下文。该模型具备前沿编程与智能体能力,支持图片、视频输入及电脑桌面操作。目前API已开放使用,同步上线Agent产品MiniMax Code,官方计划未来10天内开源模型权重。
MiniMax 发布新款模型 M3,同步上线 API 服务、Agent 产品 MiniMax Code 及订阅计划 MiniMax Token Plan。
该模型采用全新稀疏注意力架构 MSA,最高支持 1M 超长上下文,并在编程、智能体任务及原生多模态能力上达到前沿水平,支持图片、视频输入及电脑桌面操作。
根据官方提供的数据,M3 在 SWE-Bench Pro、SVG-Bench 及端到端评测框架 Claw-Eval 等多项基准测试中取得领先分数。
官方还计划在未来 10 天内更新该模型的技术报告并开源模型权重。



相关链接:
VAST 发布 Project Eden 世界模型研究预览版 #5
VAST AI Research 公布了 Project Eden 世界模型研究预览版。该模型将底层世界状态与视觉渲染解耦,构建了一个支持多人及多
Agent同步交互、持久存在且可编辑的演进环境。
VAST AI Research 公布了 Project Eden 的世界模型研究预览版,定位为首个面向 AI 原生多人及 Agent 交互的世界模型。
该系统打破了现有范式,将底层世界状态与视觉渲染解耦,把世界视为一个持续运行、可被用户动作修改且支持任意视点观测的结构化演进环境。
基于三层架构和结构视觉对齐的数据范式,Project Eden 实现了环境状态持久化、物理动态响应、可编辑复用以及多智能体同屏同步交互等能力。
目前该项目仅为研究预览阶段,官方称后续将完善状态转换模型等方向。

相关链接:
JetBrains 发布 12B 参数 MoE 架构模型 Mellum2 #6
JetBrains 官方发布并开源了
Mellum2模型,该模型总参数量为 12B、每次推理激活 2.5B 参数。官方称其专注于低延迟的文本与代码处理。
JetBrains 官方正式发布了 Mellum2 模型。
这是一个拥有 120 亿 总参数、每次生成仅激活 25 亿 参数的 Mixture-of-Experts (MoE) 架构模型。
该模型基于自然语言和代码从头训练,明确专注于文本和代码任务而不涉及多模态。
目前已采用 Apache 2.0 开源协议发布。
官方数据显示,Mellum2 在同类规模的开放模型中具有竞争力的基准测试表现。
且推理速度提升超过 两倍,非常适合用于多模型系统中的提示词分类、工具选择、上下文压缩以及私有化部署。

相关链接:
- https://blog.jetbrains.com/ai/2026/06/mellum2-goes-open-source-a-fast-model-for-ai-workflows/
- https://huggingface.co/blog/JetBrains/mellum2-launch
- https://huggingface.co/collections/JetBrains/mellum-2
Qoder多款产品开放Qwen3.7-Max每日200次免费调用 #7
Qoder宣布在多款产品中每日提供免费200次
Qwen3.7-Max模型调用。同时,QoderWork CN上线 AI生产力计划,所有用户能免费领取1个月Pro权益,现有付费用户则会自动获赠2000 Credits。
Qoder官方宣布升级Qwen3.7-Max模型体验福利,并同步推出QoderWork CN AI生产力计划。
即日起,全球版及中国版Qoder多款产品用户每日均可获200次Qwen3.7-Max免费调用额度,超出部分付费用户享半价。
在QoderWork CN计划中,所有用户登录桌面端可领1个月PRO,现有付费用户自动获2000 Credits。
面向高校师生的等同3个月PRO专属福利即将上线,目前官方已开启最高可获40000 Credits的邀请激励活动。


相关链接:
Agnes AI宣布全模态模型API无限期免费开放 #8
据媒体报道,一家名为 Agnes AI 的企业,宣布自6月1日起面向全球开发者,无限期免费开放其文本、图像和视频全模态模型API。
据媒体报道,一家名为 Agnes AI 宣布旗下三款核心模型API无限期免费开放。
涵盖支持 1M 上下文的文本模型 Agnes-2.0-Flash。
主打可编辑的图像模型 Agnes-Image-2.0-Flash。
以及支持音画同步的视频模型 Agnes-Video-V2.0。

相关链接:
SpaceXAI 在 Grok Build 中上线 Cursor 的 Composer 2.5 模型 #9
SpaceXAI 官方宣布 Cursor 的
Composer 2.5模型已上线 Grok Build,用户目前可通过相关菜单启用进行体验。
SpaceXAI 官方宣布,已在旗下的 Grok Build 中正式提供 Cursor 的 Composer 2.5 模型。
官方表示,该模型具备快速且高度智能的特性,尤其擅长处理长时间运行的任务以及遵循复杂的指令。
用户可以通过访问 x.ai/cli 获取 CLI 工具,并在 /models 菜单中选择使用该模型。


相关链接:
Cursor 推出 Premium 团队席位并提升 Teams 用量额度 #10
Cursor 宣布提高所有 Teams 用户的使用额度,并推出价格为标准版三倍但包含五倍用量的 Premium 团队席位,以满足重度使用
Agent的用户需求。
Cursor 官方宣布提升其 Teams 方案的用量上限,并引入全新的 Premium 团队席位。
标准版席位(每月 40 美元)的用量现被拆分为 Cursor 自有的 Composer 与 Auto 专属池以及第三方 API 池,在不涨价的情况下增加了额度。
新增的 Premium 席位(每月 120 美元)提供标准版 5 倍的用量,官方预计该额度足以满足 99% 用户整整一个月的高强度 Agent 使用需求。
此次变更已立即对新客户生效,7 月 1 日后续费的客户也将适用新规。

相关链接:
MiniMax Code 桌面端上线,支持多阶段任务自主运行 #11
MiniMax 推出专为
M3模型设计的 Agent 产品 MiniMax Code。该产品支持多阶段复杂任务自主运行与 Computer Use 能力,其桌面端现已开放下载。
MiniMax 随 M3 模型发布了配套的 Agent 产品 MiniMax Code(原 Mavis)。
该产品专为 M3 设计,其 Agent Team 能将复杂任务拆解为多阶段 Workflow,通过对抗式循环实现持续反思与纠错,最长可自主运行数天。
同时,得益于原生多模态能力,该产品具备支持跨应用操作的 Computer Use 功能。
目前 MiniMax Code 桌面端已开放下载,支持直接使用 MiniMax Token Plan,官方后续计划开源该项目。
相关链接:
google-gemma 团队发布 Gemma skills 开源项目 #12
Google-Gemma 团队近日在 GitHub 上线了首个版本的
Gemma skills开源项目,为构建Gemma驱动的应用及Agent交互提供指导与资源。
Google Gemma 团队发布了第一版 Gemma skills,这是一个用于 Gemma 模型和 Agent 交互的开源项目。
该项目旨在为开发者构建 Gemma 驱动的应用提供指导和资源。
内容涵盖从 MTP 到设备要求等多个方面。
目前仓库内已包含名为 gemma-dev 的技能。

相关链接:
OpenAI 推出 Codex Python SDK 供开发者集成 #13
OpenAI 发布
Codex Python SDK,开发者可通过 pip 安装将其直接嵌入 Python 应用与工作流中,支持启动线程、流式传输进度、传递图像及控制沙箱访问等功能。
OpenAI 宣布正式发布 Codex Python SDK。
该 SDK 允许开发者将 Codex 直接嵌入 Python 应用和工作流中。
它支持启动线程、运行轮次、流式传输进度、恢复会话、传递图像以及控制沙箱访问,同时可复用现有的 Codex 认证。
开发者可通过 pip install openai-codex 命令进行安装。

相关链接:
Hermes Agent 原生登陆 Windows,无需 WSL 即可运行 #14
Hermes Agent 现已原生支持 Windows 10 与 11 系统,官方已同步更新详细的安装指南,用户无需依赖
WSL、Cygwin或Docker即可运行该Agent。
Hermes Agent 现已原生适配 Windows 10 与 Windows 11。
官方提供了 PowerShell 一键安装脚本与图形化桌面安装程序两种方式。
运行时将自动配置 Python、Node.js 与 PortableGit 等环境,并默认使用 Git Bash 执行命令。
绝大多数功能(包括 消息网关、浏览器工具 与 MCP 服务器 等)已实现原生运行。
仅 Web 仪表盘 内的嵌入式终端窗格因系统限制仍需使用 WSL 环境。
相关链接:
- https://hermes-agent.nousresearch.com/docs/user-guide/windows-native
- https://x.com/NousResearch/status/2061236625925886252
Google AI Studio 支持直连 Gmail 等多项服务 #15
Google AI Studio 现已推出全新集成功能,允许用户直接在平台内构建连接
Gmail、Drive和Sheets等 Google 服务的应用。
Google AI Studio 的 Build 功能现已推出与 Google 服务的全新集成,允许开发者直接在平台内构建连接 Gmail、Calendar、Drive 和 Sheets 等服务的应用。
此次更新使用户无需导航至其他网站,即可在 AI Studio 内部为开发的应用添加测试人员。该功能的完整公开分享目前尚未上线,但官方预告即将推出。
同时,当前临时性的双行界面布局也预计将在 几天内 调整合并。

相关链接:
- https://x.com/OfficialLoganK/status/2061568290984800740
- https://x.com/testingcatalog/status/2061583807686279669
扣子 3.0 正式上线,新增项目空间与多端 Agent 协同调度 #16
扣子 3.0 正式上线,手机、电脑及网页端全量更新。平台新增
项目空间,支持多端调度Agent并组建团队协同推进任务。
扣子 3.0 正式上线,手机端、电脑端与网页端均已完成全量更新。
本次升级引入项目空间功能,用户可在其中创建项目,并组建包含云端与本地接入 Agent 的团队进行分工协作。
云端 Agent 运行于平台提供的云电脑中,而本地 Agent 支持接入 Claude Code 等框架,用户可通过手机 App 远程调度其处理本地文件。
此外,平台还升级了技能商店与特定项目模板,但目前新建云端 Agent 与使用职业模板为高阶版及以上会员权益。
相关链接:
ChatGPT 推出全屏长文编辑及单条消息切换模型功能 #17
ChatGPT 官方宣布支持全屏编辑长文本的功能,并允许保存至
Library。同时 iOS 端新增按住发送键为单条消息临时选用特定模型的交互功能。
ChatGPT 官方宣布为长篇幅写作提供更大空间。
现已支持在全屏模式下编辑较长文本,并可将内容保存至 Library 以便后续查看。
在产品交互方面,iOS 端 ChatGPT 还允许用户通过长按发送按钮,在不更改默认设置的前提下,为当前单条消息挑选不同的 模型。


相关链接:
- https://x.com/ChatGPTapp/status/2061571468992126982
- https://x.com/JustinBleuel/status/2061516207019188581
Perplexity推出Search as Code搜索架构并上线Agent API #18
Perplexity 推出全新搜索架构
Search as Code,让 Agent 通过生成 Python 代码调用搜索底层原语,现已上线Agent API并成为Computer默认设置。
Perplexity 官方发布名为 Search as Code (SaC) 的新型搜索架构,摒弃了传统的串行函数调用,转而让 Agent 通过在安全沙盒中生成和执行 Python 代码来编排搜索堆栈。
该架构由 Agentic Search SDK、安全沙盒和模型控制平面组成,允许模型直接控制检索、排序、去重和过滤等原子化操作,从而解决传统搜索带来的高延迟和上下文污染问题。
目前 SaC 已在 Perplexity Agent API 中可用,并成为 Computer 的默认设置。

相关链接:
Anthropic向美国SEC机密提交S-1草案以筹备潜在IPO #19
Anthropic宣布已向美国证券交易委员会机密提交
S-1草案注册声明,待SEC审查完成后,该公司将拥有推进首次公开募股的选择权。
Anthropic官方宣布,已向美国证券交易委员会(SEC) 机密提交了一份关于其普通股拟议首次公开募股(IPO)的S-1草案注册声明。
此次提交使得Anthropic在SEC完成审查后获得了选择上市的权利。
但拟议的IPO能否最终实施仍将取决于届时的市场条件及其他相关因素。
目前,拟发行的股票数量和价格区间均尚未确定。
该声明仅为流程审查之用,并非出售证券的要约。

相关链接:
- https://www.anthropic.com/news/confidential-draft-s1-sec
- https://x.com/AnthropicAI/status/2061478052257841495
Alphabet 计划通过股权发行筹资 800 亿美元用于 AI 建设 #20
Google 母公司 Alphabet 官方宣布计划通过出售股权筹集 800 亿美元,以扩大其 AI 基础设施与全球算力。Alphabet 在声明中称,目前企业和消费者对其
AI服务的需求已超过公司现有的供应能力。
Google 母公司 Alphabet 官方宣布,计划通过一揽子股权发行方式筹集 800 亿美元,用于扩大 AI 基础设施和全球算力。
该项筹资计划包含从第三季度开始的 400 亿美元按市价发行计划、300 亿美元的股票及强制性可转换优先股承销发行,以及与 Berkshire Hathaway 达成的 100 亿美元投资交易。
Alphabet 在声明中称,目前企业和消费者对其 AI 服务的需求已超过公司现有的供应能力。

相关链接:
- https://abc.xyz/investor/news/news-details/2026/Alphabet-Announces-Proposed-80-Billion-Equity-Capital-Raise-to-Expand-AI-Infrastructure-and-Compute-2026-b0myAMewCa/default.aspx
- https://s206.q4cdn.com/479360582/files/doc_news/2026/Jun/01/attachments/2026-June-Alphabet-Equity-Capital-Raise-Press-Release-PDF.pdf
智谱拟申请科创板上市,发行全部为新股 #21
智谱公告称,董事会已通过建议,拟申请发行 A 股并在 科创板上市。此次发行全部为新股,募资将用于
大模型及MaaS平台建设。
智谱在港交所发布公告,其董事会已通过决议,建议向中国相关监管机构申请配发及发行 A 股,并向上交所申请在科创板上市及交易。
该建议 A 股发行将全部为新股,数量占发行完成后公司总股本的 2% 至 8%,原股东不公开发售股份。
募集资金拟投资于人工智能通用基座大模型、大模型 MaaS 一站式服务平台及补充流动资金。
相关决议案和英文名称变更事项,后续将在年度股东会上提请股东批准。

相关链接:
OpenAI多款模型及Agent登陆Amazon Bedrock #22
OpenAI 宣布
GPT-5.4、GPT-5.5及 Codex 已在 Amazon Bedrock 全面上线,企业可通过 AWS 现有安全合规的工作流调用这些模型。
OpenAI 与 Amazon Web Services 官方宣布,OpenAI 前沿模型 GPT-5.4、GPT-5.5 以及编程 Agent Codex 现已在 Amazon Bedrock 平台全面可用。
企业可以通过 Bedrock 的下一代推理引擎按需自动扩展部署,并利用现有的 AWS 安全、合规与治理工作流来构建处理多步骤编码、数据分析及知识工作的自主 Agent。
开发者可将 Codex 引入本地 CLI、桌面和 IDE 工作流中,通过 AWS 原生验证路由所有模型调用并按 token 付费。
官方称此次集成是 OpenAI 能力在 AWS 上更广泛扩展的开始,未来计划提供名为 Daybreak 的网络安全功能。

相关链接:
Intel 发布 Crescent Island GPU,最高配备 480GB 显存 #23
Intel 在 Computex 2026 上发布数据中心 AI 显卡
Crescent Island,该卡基于Arc Xe 3P架构,最高提供 480GBLPDDR5X显存,专为 AI 推理工作负载打造。
在 Computex 2026 上,Intel 发布了面向数据中心的 AI 加速显卡 Crescent Island,以满足现代数据中心在 AI 训练和推理方面日益增长的需求。
该产品基于最新的 Arc Xe 3P 架构,采用风冷散热设计,TDP 为 350W,并选用了 LPDDR5X 内存而非传统的 HBM。
在显存容量上,公版规格为 160GB,而通过 ODM 合作伙伴定制的版本最高可扩展至 480GB。
官方表示,该显卡支持从原生 FP4/MXFP4 到 FP64 的多种数据类型和微缩放格式,专门针对下一代 AI 工作负载进行了优化。

相关链接:
报道称佛罗里达州起诉 OpenAI 及 CEO 指控其无视安全警告 #24
据媒体报道,佛罗里达州对 OpenAI 及其首席执行官 Sam Altman 提起诉讼,指控该公司无视安全警告发布对用户有害的
ChatGPT。
据媒体报道,佛罗里达州 已在州法院对 OpenAI 及其首席执行官 Sam Altman 提起诉讼。
该诉讼指控 OpenAI 无视安全警告,在明知其人工智能产品 ChatGPT 对用户有害的情况下依然将其发布。
起诉书指控其违反了产品责任法、存在疏忽及欺骗性贸易行为,州政府 要求获得民事赔偿,并寻求法院下令禁止该公司在未经父母同意的情况下收集 13 岁以下 用户的某些数据。
相关链接:
- https://assets.bwbx.io/documents/users/iqjWHBFdfxIU/r1fkLwwtQiaE/v0
- https://www.bloomberg.com/news/articles/2026-06-01/florida-sues-openai-sam-altman-over-chatbot-safety-concerns
据称 OpenAI 收紧多项账号限制 #25
据社区讨论,OpenAI近期收紧账号规则。免费账号月额度降约**75%**且仅限两款
模型,手机号绑定限制与验证频率亦被大幅提高。
据社区网友近期讨论汇总,OpenAI 正在对其账号体系进行一系列收紧调整。
主要涉及免费账号额度、模型使用范围以及手机号绑定等多个方面。
在免费账号层面,其额度计算周期已从按周变更为按月,且月度总可用额度下降了约75%。
同时,可用模型被限制为仅能使用 codex-auto-review 与 gpt-5.5。
此外,账号的手机号绑定规则大幅收紧。
短时间内单手机号仅能绑定一个账号。
且免费账号注册及授权 Codex 时的验证变得更加严格。
Plus 付费套餐也面临着认证频率提高、大概率每周需重新认证的情况。

相关链接:
报道称 Anthropic 拟向欧盟开放 Mythos,OpenAI 向九家英国银行提供 GPT-5.5 Cyber #26
据媒体报道,Anthropic 计划向欧盟网络安全局开放
Mythos模型进行预发布测试,而 OpenAI 则向九家无法使用Mythos的英国银行提供了其GPT-5.5 Cyber工具。
据彭博社和 BBC 报道,Anthropic 计划允许欧盟网络安全局加入 玻璃之翼 计划。
在 Mythos 模型大规模发布前进行安全测试,上周末已将此决定告知欧盟委员会。
由于 Anthropic 在 Mythos 预览中封锁了英国金融机构的访问,OpenAI 借机向九家英国主要银行以及欧盟、日本和加拿大的机构提供了 GPT-5.5 Cyber 的访问权限。
两款工具均采取限制性开放策略,仅面向特定的政府和商业机构。
相关链接:
NVIDIA 发布 Cosmos 3 开源物理 AI 全模态模型 #27
NVIDIA 官方发布了开源世界基础模型
Cosmos 3,该模型采用 Mixture-of-Transformers 双塔架构,旨在统一处理物理 AI 的视觉推理、多模态生成与动作预测。
NVIDIA 正式推出了 Cosmos 3 世界基础模型家族。
该模型基于 Mixture-of-Transformers 架构,包含负责自回归推理与扩散生成的双塔结构,可同时支持视觉推理、视频生成及机器人动作预测等多种模态。
根据官方提供的数据,Cosmos 3 在 Artificial Analysis 的文本生成图像与图像生成视频开放权重榜单,以及 VANTAGE-Bench、TAR 等 8 个物理 AI 基准测试中均排名第一。
目前 NVIDIA 已开放 Cosmos 3 Super 与 Cosmos 3 Nano 两个版本的权重。

相关链接:
- https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-3-the-open-frontier-foundation-model-for-physical-ai
- https://developer.nvidia.com/blog/develop-physical-ai-reasoning-world-and-action-models-with-nvidia-cosmos-3
- https://research.nvidia.com/labs/cosmos-lab/cosmos3/technical-report.pdf
- https://www.nvidia.com/en-us/ai/cosmos/
- https://huggingface.co/collections/nvidia/cosmos3
- https://github.com/nvidia/Cosmos
NVIDIA 宣布将于本周发布 Nemotron 3 Ultra 模型 #28
NVIDIA宣布将于本周发布开源模型
Nemotron 3 Ultra。该模型拥有550B参数,55B的激活参数。官方称还会提供NVFP4量化版本,以实现更高的推理性能。
NVIDIA 在黄仁勋的 Computex 主题演讲中宣布推出 Nemotron 3 Ultra 模型,官方社交账号确认其将于本周发布。
该模型总参数约 550B,具有 90% 稀疏度,激活参数为 55B,是迄今最大的 Nemotron 3 模型。
据评测机构 Artificial Analysis 数据,它在 AI 智能指数中获得 48 分,成为最智能的美国开源模型。
同时在 DeepInfra 的预发布节点上实现了每秒超过 300 个 token 的生成速度。
该模型除 BF16 权重外,还将提供 NVFP4 量化版本以获得更高推理性能。


相关链接:
NVIDIA 发布 Vera CPU 与 DSX 平台赋能 Agentic AI 工厂 #29
NVIDIA 宣布
Vera Rubin平台全面投入生产,旨在为全球Agentic AI工厂提供动力。同时,NVIDIA 发布了专为Agent设计的Vera CPU、用于构建工厂管理Agent的FOX蓝图,以及提供AI工厂设计指南的DSX平台。
NVIDIA 宣布 Vera Rubin 平台正在全面投产,以为 Agentic AI 工厂提供基础设施,预计 今年秋季 开始出货。
该平台集成了 NVIDIA Vera CPU,官方称其在 Agentic 任务上的速度比 x86 架构快 1.8 倍,获得 SpaceXAI、OpenAI 等客户支持。
此外,NVIDIA 还发布了 DSX 平台以协助基础设施构建,推出了包含安全存储能力的 Vera BlueField-4 STX。
并推出了用于构建自主工厂管理 Agent 的 Factory Operations Blueprint (FOX)。
相关链接:
- https://nvidianews.nvidia.com/news/vera-rubin-full-production-agentic-ai-factory
- https://www.nvidia.com/en-us/data-center/vera-cpu/
- https://www.nvidia.com/en-us/data-center/products/dsx/
- https://blogs.nvidia.com/blog/factory-operations-fox-blueprint-ai-brain/
- https://www.nvidia.com/en-us/networking/products/software/doca
NVIDIA 发布 RTX Spark 超级芯片进军 Windows AI PC 市场 #30
NVIDIA 发布基于 Arm 架构的
RTX Spark超级芯片,配备 128GB 统一内存,专为在 Windows PC 本地安全运行个人智能体设计,搭载该芯片的设备预计今年秋季上市。
NVIDIA 在 GTC 台北 宣布推出采用 3nm 工艺的 RTX Spark 超级芯片。
该芯片集成 20 核 Grace CPU 与 6144 个 CUDA 核心,提供 1 PetaFLOP FP4 算力,支持本地运行 1200 亿 参数大语言模型。
搭载该芯片的 Windows 笔记本电脑及台式机预计于 今年秋季 由 微软、戴尔、惠普 及 联想 等厂商交付,Acer 和 技嘉 等厂商将随后跟进。
针对企业级桌面端,NVIDIA 联合 微软 推出了 DGX Station,搭载 GB300 超级芯片并支持本地运行万亿参数模型,预计于 今年第四季度 供货。

相关链接:
- https://www.nvidia.com/en-us/products/rtx-spark/
- https://www.nvidia.com/en-us/products/workstations/dgx-station-for-windows/
- https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark
- https://nvidianews.nvidia.com/news/nvidia-dgx-station-for-windows-puts-a-trillion-parameter-ai-supercomputer-on-every-enterprise-desk
NVIDIA 推出 Alpamayo 2 Super 及 AlpaGym 闭环训练框架 #31
NVIDIA 发布 320 亿参数的
Alpamayo 2 Super自动驾驶推理模型,并同步推出AlpaGym闭环强化学习框架等配套工具,该模型预计今年夏天上线。
NVIDIA 官方宣布推出拥有 320 亿 参数的 Alpamayo 2 Super 视觉语言动作(VLA)模型,用于推进安全的 L4 级自动驾驶汽车开发。
该模型具备 360 度全环绕感知与宏观决策输出能力。
作为教师模型,它可被蒸馏至更小的模型中以在车载计算平台上运行。
为完善训练流程,NVIDIA 同步推出了用于闭环训练的开源 AlpaGym 框架、OmniDreams 生成式世界模型以及开源的 CoC 自动标注管线。
Alpamayo 2 Super 的推理代码与模型权重预计于今年夏天在 GitHub 和 Hugging Face 上提供。

相关链接:
- https://nvidianews.nvidia.com/news/nvidia-alpamayo-2-super-robotaxis
- https://www.nvidia.com/en-us/solutions/autonomous-vehicles/alpamayo/
- https://developer.nvidia.com/blog/how-to-post-train-autonomous-vehicle-models-in-closed-loop-with-nvidia-alpamayo/
- https://github.com/NVlabs/alpamayo-recipes
NVIDIA扩大DRIVE Hyperion生态,联手车企与Uber推进L4自动驾驶 #32
NVIDIA宣布
DRIVE Hyperion平台生态大规模扩展。BYD、吉利等车企正基于该平台开发L4级自动驾驶车辆,Uber等供应商也规划在全球部署Robotaxi车队。为加速商业化,NVIDIA推出Halos OS安全架构与Alpamayo 1.5模型。
NVIDIA 宣布其 DRIVE Hyperion 平台生态正在全球范围内大规模扩展,吸引多家头部车企及出行网络接入。
BYD、吉利、日产及五十铃等车企正基于该平台及 DRIVE AGX Thor 芯片开发 L4 级别的自动驾驶车辆。
而 Uber、Bolt 等出行供应商则利用该平台的软硬件栈规划在全球多地部署 Robotaxi 车队。
为支持这一生态,NVIDIA 推出了包含统一安全架构的 Halos OS,并发布了 Alpamayo 1.5 模型,提供在闭环环境中进行后训练的能力。
根据合作规划,首批搭载该平台的 Uber 自动驾驶车队计划于 2027 年上半年 上线,并逐步扩展至全球 28 个城市。

相关链接:
- https://developer.nvidia.com/blog/how-to-post-train-autonomous-vehicle-models-in-closed-loop-with-nvidia-alpamayo
- https://nvidianews.nvidia.com/news/nvidia-drive-hyperion-becomes-the-global-platform-for-a-robotaxi-ready-world
- http://nvidianews.nvidia.com/news/drive-hyperion-level-4
- https://www.nvidia.com/en-us/solutions/autonomous-vehicles/drive-hyperion/
- https://www.nvidia.com/en-us/ai-trust-center/halos/autonomous-vehicles/
NVIDIA 发布首个开源人形机器人参考设计 Isaac GR00T #33
NVIDIA 宣布推出首个开源人形机器人参考设计 NVIDIA Isaac GR00T Reference Humanoid Robot,该平台整合
Unitree机器人硬件与NVIDIA Jetson Thor算力,主要面向前沿学术研究,预计将于 2026 年底正式供货。
NVIDIA 发布了首个开源人形机器人参考设计 NVIDIA Isaac GR00T Reference Humanoid Robot,旨在通过提供高级硬件和开源软件栈加速学术界的物理 AI 研究。
该参考设计将 Unitree H2 Plus 机器人底盘、Sharpa Wave 五指灵巧手与 NVIDIA Jetson AGX Thor T5000 计算平台相整合,实现全身 75 个自由度 的控制与实时端侧推理。
配套的 Isaac GR00T 开发平台提供了包含遥操作数据采集、基础模型、仿真训练及部署在内的全栈模块化工作流,且未来也将支持 Unitree G1 机器人。
包括 斯坦福大学 和 ETH Zurich 在内的多家顶尖研究机构计划采用该设计,其硬件预计将于 2026 年底 通过 Unitree 渠道对外提供。

相关链接:
- https://nvidianews.nvidia.com/news/nvidia-open-humanoid-robot-reference-design
- https://developer.nvidia.com/isaac/gr00t
- https://github.com/NVIDIA/Isaac-GR00T
NVIDIA 发布企业与 Physical AI 开源 Agent 工具包 #34
NVIDIA 宣布推出一套面向企业与
Physical AI的开源Agent工具与模型组合,核心包含 NemoClaw 蓝图、OpenShell 运行时,旨在将复杂的机器人、工业与工程工作流转化为可由Agent执行的任务。
NVIDIA 在 GTC Taipei 期间宣布了其 Agent 生态系统的最新进展。
该公司将 Cosmos、Omniverse、Isaac 等 Physical AI 库以及 CUDA-X 库转化为开源的、可由 Agent 调用的技能,帮助开发者自动化机器人、自动驾驶和数字孪生的开发流程。
此次发布包含了用于构建长周期自主 Agent 的 NemoClaw 蓝图、提供安全治理的 OpenShell 运行时早期预览版。
包括 Cadence、西门子、Foxconn 和 TSMC 在内的多家行业巨头已开始接入这些工具,以构建用于芯片设计、工业制造、医疗和视觉检测的自主 AI 工程师。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。