2026-03-13

AI 早报 2026-03-13
概览
要闻
模型发布
开发生态
- Claude Code 推出语音模式,引入设置脚本功能 ↗
#5 - Google 调整 Antigravity 计费,Pro 刷新周期延至 7 天
#6 - Google Gemini API 现可设置消费上限 ↗
#7 - OpenRouter 上线 Auto Exacto 降低工具调用错误率 ↗
#8 - Hermes Agent v0.2.0 发布,支持多 IDE 集成 ↗
#9 - 斯坦福大学开源 OpenJarvis 框架支持本地优先个人 AI ↗
#10
产品应用
- 谷歌地图集成 Gemini 推出十多年来最大规模升级 ↗
#11 - xAI 发布 Grok 新视频功能,支持 7 张参考图转视频 ↗
#12 - 微软推出 Copilot Health 整合设备与健康记录数据 ↗
#13 - OpenClaw 生态密集更新,百度联想阶跃发布新服务 ↗
#14 - Perplexity 向Pro 用户开放 Perplexity Computer
#15 - 淘宝 PC 端支持 MCP,可接入OpenClaw ↗
#16 - ComfyUI 发布 App Mode 及 ComfyHub 支持工作流分享 ↗
#17 - Canva 推出 Magic Layers 支持平面图转多层可编辑 ↗
#18
技术与洞察
- Cursor 发布 CursorBench 评测体系,优化 Agent 编程评估 ↗
#19
行业动态
- Google 完成收购 Wiz,将加入 Google Cloud 运营 ↗
#20 - 腾讯回应 OpenClaw 数据争议:称仅拉取 1GB 分担流量 ↗
#21 - 智谱新模型启动内测,面向 Max 计划用户开放申请 ↗
#22
前瞻与传闻
- 据传阿里 Qwen 后训练负责人郁博文加盟字节跳动 Seed 团队
#23 - 英伟达计划五年投入 260 亿美元研发开放权重 AI 模型 ↗
#24
GitHub 调整 Copilot 学生计划,取消 GPT-5.4 等模型自选权限 #1
GitHub 宣布即日起调整 Copilot 学生计划,不再支持学生自主选择
GPT-5.4、Claude Opus等高级模型。
GitHub Education Team 宣布调整 Copilot 学生计划。官方称,为确保全球近 200 万 学生持续获得免费服务,即日起该计划不再支持用户自主选择 GPT-5.4、Claude Opus 及 Claude Sonnet 等高级模型。
但认证学生免费访问权限、学术验证状态及高级请求单位配额保持不变。

相关链接:
Claude 支持生成式 UI,聊天界面构建交互式图表 #2
Claude 上线了原生交互式图表功能,以 Beta 形式向包括免费版在内的所有订阅计划开放。
用户可在对话中直接阅读解释并即时交互可视化内容。
Anthropic 官方宣布,Claude 现已支持在聊天界面构建交互式图表与示意图。该功能被称为 "Generative UI",通过内嵌 Visualizer 组件实现,目前以 Beta 形式向所有订阅计划开放。
官方人员称,与 Artifact 不同,Visualizer 存在于对话流中,允许用户即时交互,而非独立交付物。

相关链接:
OpenAI 视频 API 上线新功能 #3
OpenAI 更新 Video API,提供由
Sora 2驱动的自定义角色与对象、最长 20秒 视频生成、场景延续及批量处理等核心功能。
OpenAI Developers 官方宣布在 Video API 中面向所有开发者全量上线由 Sora 2 驱动的新功能。
此次更新核心特性包括:支持自定义角色和对象、16:9 及 9:16 比例导出、生成长达 20 秒 的视频片段、用于扩展场景的视频延续功能,以及批量视频生成任务。

相关链接:
NVIDIA 发布 NVILA-8B-HD-Video 模型,支持 4K 视频输入 #4
NVIDIA 开源了 NVILA-8B-HD-Video 多模态大模型,专门处理 4K 分辨率、千帧级别的高清长视频。
核心亮点是 AutoGaze 技术,能把视频
Token压缩 100 倍,推理延迟最高降低 19 倍。在 HLVid 长视频基准测试上,该模型达到业界最优。
NVIDIA 在 Hugging Face 发布 NVILA-8B-HD-Video 模型。这是一款 8B 参数多模态大语言模型,专为高分辨率长视频理解设计。
该模型支持 4K 分辨率和 1K 帧视频输入,集成 AutoGaze 技术。官方数据显示,该技术可将视频 Token 数量减少最多 100 倍,ViT 和 LLM 延迟分别降低最多 19 倍和 10 倍。
模型在 VideoMME 基准测试中性能提升,并在 HLVid 基准上达到 SOTA 水平。
该模型基于 NVILA-Lite-8B 开发,采用 CC-BY-NC-SA-4.0 许可协议,仅限研发使用。

相关链接:
Claude Code 推出语音模式,引入设置脚本功能 #5
Claude 在 Claude Code 桌面端及 Cowork 平台上线了语音模式。此外,Claude Code Web 端和桌面端新增设置脚本功能,支持在云端环境启动前自动完成依赖安装与配置。
Claude Code 近期宣布推出语音模式,该功能现已正式支持桌面端及 Cowork 平台,进一步丰富了用户的交互方式。
此外,该工具面向 Web 端和桌面端引入了设置脚本功能。通过添加设置脚本,用户能够在云端环境启动之前,自动化完成环境配置工作。根据官方说明,这项功能对于安装依赖项、调整系统设置以及管理配置文件等场景尤为实用,有效提升了开发环境的初始化效率。


相关链接:
- https://x.com/lydiahallie/status/2032242047437193346
- https://x.com/trq212/status/2032241451560812631
Google 调整 Antigravity 计费,Pro 刷新周期延至 7 天 #6
Antigravity应用正式调整计费规则,从单一配额制改为“固定配额加AI积分”的混合模式。
Pro用户配额刷新周期从5小时延长至7天,每月获赠1000积分;
Ultra用户保持5小时刷新,拥有约25000积分。
Google旗下 Antigravity 应用近期调整计费模式,确立了“固定配额+AI Credit”体系,积分消耗依据 Vertex API 定价计算。
在权益方面,AI Pro 用户配额刷新周期改为7天,每月获赠 1000点 积分(约 10美元);据称 Ultra 用户则保留5小时刷新机制,并拥有约 25000至26000点 积分(约 250美元),该积分支持家庭组共享。
目前,Antigravity 已在设置中新增可视化仪表盘,用户需手动开启“AI积分超额使用”选项,方可在基准配额耗尽后自动抵扣积分。
若有额外需求,官方支持购买更多 AI Credit。

Google Gemini API 现可设置消费上限 #7
Google 宣布 Gemini API 正式支持消费上限功能,开发者即日起可通过 AI Studio 在项目层级设置额度以管控成本。
需特别注意的是,配置生效最长存在 10 分钟 延迟,且目前暂不支持
Vertex AI及代码端设置。
Gemini API 现已正式支持 "Spend caps"(消费上限)功能。即日起,开发者可通过 AI Studio 设置该上限,以在构建应用时获得更高的成本控制权。
根据官方说明,该功能目前仅支持在 UI 界面设置,且作用于 Project(项目)层级而非 API Key 层级;上限设置后可能存在最长 10 分钟 的延迟才能生效,期间产生的超额费用仍需由用户承担。
此外,官方正计划移除原有的 10 美元 一次性预付款要求,并将整个 API 转向预付费模式。

相关链接:
OpenRouter 上线 Auto Exacto 降低工具调用错误率 #8
OpenRouter 宣布推出自适应质量路由机制 Auto Exacto,默认用于工具调用请求。该系统通过整合吞吐量与数十亿次工具调用遥测数据,每 5分钟 动态评估,能够有效降低模型工具调用错误率。
OpenRouter 正式宣布推出 “Auto Exacto” 功能,这是一种自适应质量路由机制,目前已针对所有包含工具调用(tool-calling)的请求默认启用。
该系统通过整合吞吐量、工具调用遥测数据以及 TauBench Verified Airline 和 GPQA-Diamond 等基准测试分数这三大信号,大约每 5 分钟 对供应商进行一次重新评估,旨在解决新模型发布初期供应商表现差异巨大的问题。
根据官方提供的数据,在过去几天中,这一新算法将不同模型的工具调用错误率降低了 15% 至 90%。
对于非工具调用请求,用户可以通过在任意模型标识后附加 :exacto 来启用该质量加权路由,该功能运作方式类似于现有的 :nitro 或 :floor 后缀。

相关链接:
Hermes Agent v0.2.0 发布,支持多 IDE 集成 #9
NousResearch 正式发布了 Hermes Agent v0.2.0,该版本通过集成
MCP客户端与ACP服务器,实现了与 VS Code 及 JetBrains 的无缝连接,并将 智谱 GLM、Kimi 和 MiniMax 纳入原生支持体系。
NousResearch 正式发布 Hermes Agent v0.2.0。据官方社交账号显示,该项目两周内汇聚 63 位贡献者,合并 216 个 PR,提交超 1200 次。
该版本核心提升互操作性,搭载 MCP 客户端并内置 ACP 服务器,允许 VS Code 等编辑器作为前端。模型原生支持 智谱,兼容 Kimi、MiniMax 及 OpenAI OAuth。
安全上引入文件系统检查点与 /rollback 机制,利用 git worktree 实现并行任务隔离。工具层面集成无需 API Key 的本地无头 Chromium 浏览器,增强子 Agent 透明度。
技能库扩展至 15 个类别的 70 多项,涵盖 Solana 区块链及 Google Workspace 等领域。

相关链接:
斯坦福大学开源 OpenJarvis 框架支持本地优先个人 AI #10
斯坦福大学研究人员推出了开源框架 OpenJarvis,旨在构建默认在本地运行、仅在必要时调用云端的个人 AI 系统。
斯坦福大学的研究人员推出了 OpenJarvis,这是一个专为构建本地优先个人 AI 而设计的开源框架。该项目旨在让个人 AI 默认在本地设备上运行,仅在必要时调用云端资源。
OpenJarvis 构建于五大原语之上,涵盖了从模型层、推理引擎到 Agent 行为、工具与记忆以及闭环学习的完整技术栈,支持 MCP 和 Google A2A 等协议,并集成了针对能耗、延迟及成本的一流评估指标。
该框架兼容 Ollama、vLLM 等多种推理后端,提供 Python SDK、CLI 及桌面端应用。

相关链接:
谷歌地图集成 Gemini 推出十多年来最大规模升级 #11
Google Maps 宣布推出重大升级,通过集成
Gemini模型,上线了对话式探索功能 “Ask Maps” 和视觉革新的 “Immersive Navigation”。
Google Maps 宣布迎来十多年来最大规模升级,集成 Gemini 模型推出两项核心功能。
Ask Maps 支持自然语言查询和个性化行程规划,利用超 3 亿 地点和 5 亿 社区贡献者数据提供建议,现已在美印移动端上线。
Immersive Navigation 重构驾驶体验,提供含丰富道路细节的 3D 视图、自然语音引导及实时路况预警。该功能即日起在美国推出,未来数月将扩展至多平台及车机系统。

相关链接:
xAI 发布 Grok 新视频功能,支持 7 张参考图转视频 #12
xAI 团队为 Grok Imagine 上线了全新的“图生视频”功能,最新版本支持上传最多 7 张任意元素的参考图,即可生成画面流畅且特征一致的视频。
xAI 团队成员 Ethan He 宣布,Grok Imagine 正式推出 reference-to-video 功能。
用户更新应用后,可上传最多 7 张包含角色或物体等元素的参考图,转化为视频。
据其描述,该技术能生成流畅一致的群组场景,确保角色特征真实。

相关链接:
微软推出 Copilot Health 整合设备与健康记录数据 #13
Microsoft 推出了 Copilot Health,这是一个具备医疗智能的独立安全空间,支持连接
Apple Health等五十多种可穿戴设备及电子病历,提供基于权威来源的问答服务和医生匹配。
Microsoft 正式推出 Copilot Health,作为 Copilot 内部独立安全空间。该功能支持连接 Apple Health 等 50 多种可穿戴设备,通过 HealthEx 接入超 5 万家美国医疗机构电子健康记录,并整合 Function 实验室检测结果。
其提供基于权威来源且附带引用的问答服务,并提供医生寻找服务。为确保隐私,对话数据与通用 Copilot 隔离且绝不用于模型训练,已获得 ISO/IEC 42001 认证。
现面向美国 18 岁及以上用户开启英文版的等待名单,计划扩展至全球。官方强调该服务不用于诊断或替代专业医疗建议。

相关链接:
OpenClaw 生态密集更新,百度联想阶跃发布新服务 #14
OpenClaw发布新版,修复了编程Bug并支持
Hunter Alpha等模型。 阶跃星辰上线云端Agent服务StepClaw,已开放5万个免费名额。 百度推出手机端应用红手指Operator,联想则宣布将在小新及YOGA平板首发本地化的PadClaw技术。
OpenClaw 发布新版本,官方称支持 Hunter Alpha 等模型并修复 Bug,显著提升了编程性能。
阶跃星辰推出云端 Agent 服务 StepClaw,用户可一键部署并实现 7x24 小时云端运行,官方宣布开放 5 万个免费体验名额。
百度发布全球首款手机龙虾应用红手指 Operator,支持通过自然语言指令操控手机 App 执行任务。
联想宣布将在小新及 YOGA 系列平板上首发端侧一键部署 PadClaw 技术,强调本地化运行优势。
更多细节预计将在近期发布会上揭晓。

相关链接:
- https://github.com/openclaw/openclaw/releases/tag/v2026.3.11-beta.1
- https://mp.weixin.qq.com/s/LvOo7f_PoYEwTKGI_FLatQ
Perplexity 向Pro 用户开放 Perplexity Computer #15
Perplexity 宣布 Perplexity Computer 正式面向 Pro 用户开放,该产品集成了二十多种先进模型与数百个连接器,支持自定义技能。
Perplexity 宣布,Perplexity Computer 正式面向 Pro 订阅用户开放。该产品集成了 20 多种先进模型,支持使用预置与自定义技能及数百个连接器,旨在提供更强大的处理能力。
针对此次发布,官方推出了相应的额度奖励政策。目前所有 Pro 用户均可获得 4000 个奖励额度。此外,Max 订阅用户相比 Pro 用户享有更高的消费限额及每月 10000 个循环额度。

淘宝 PC 端支持 MCP,可接入OpenClaw #16
据用户发现,淘宝桌面版现已支持 MCP 协议,并可通过
OpenClaw实现一键配置。
据社区用户反馈,淘宝桌面版(pc.taobao.com)现已支持 MCP 协议,并可通过 OpenClaw 实现一键配置。该功能使得各大 AI 工具能够调用 taobao-native 工具集,提供搜索商品、加入购物车、扫描页面元素及输入文本等接口。

相关链接:
ComfyUI 发布 App Mode 及 ComfyHub 支持工作流分享 #17
ComfyUI官方推出全新工具系统,让任何工作流都能变成可分享的应用程序。核心功能包括 App Mode、App Builder 和可分享URL,接收方无需安装就能在浏览器里直接运行。
同时上线的 ComfyHub 预览版是一个社区分享平台,方便用户快速找到即用型工作流。
ComfyUI 官方宣布推出包含 App Mode、App Builder、URL 分享 及 ComfyHub 的工具系统,旨在将工作流转化为无需节点图经验的应用程序。
App Mode 隐藏复杂节点,据称对移动端友好;App Builder 允许精确配置参数;通过 URL 分享,接收方可免安装直接运行。
同时,社区平台 ComfyHub 预览版已上线,供用户浏览精选工作流。
目前,核心功能已在 Comfy Cloud 和 Comfy Local 上线,后者还针对 NVIDIA RTX 5090 和 AMD RX 9070 XT 等最新 GPU 进行了优化。

相关链接:
Canva 推出 Magic Layers 支持平面图转多层可编辑 #18
Canva 推出 Magic Layers 新功能,能把平面图片和
AI生成的视觉效果变成多层可编辑设计。用户不用重新生成,就能单独调整对象、文字等细节。
Canva 近日宣布推出 Magic Layers 功能,该功能现已在美、英、加、澳四国进入公开测试阶段。
据官方介绍,此功能可将平面图片及 AI 生成的视觉效果转化为多层、完全可编辑的设计。
用户在保留原始布局的前提下,可单独选择并编辑对象、文本框等组件。

相关链接:
Cursor 发布 CursorBench 评测体系,优化 Agent 编程评估 #19
Cursor 官方发布了名为 CursorBench 的混合评测体系,利用内部真实开发会话构建离线评测,并结合线上受控实验,以解决公开基准存在的数据污染和任务失真问题。
Cursor 近日分享了针对智能体编程任务的模型评分新方法,采用线上与线下结合的混合评测流程,以确保对模型质量的判断始终与开发者的真实工作方式保持一致。
其内部离线评测套件 CursorBench 基于工程团队的真实会话构建,而非公开代码仓库,有效解决了公开基准在一致性、评分逻辑及数据污染方面的局限性。
最新版本的 CursorBench-3 任务规模较初版翻倍,覆盖多工作区环境等复杂场景,官方数据显示其能更好地区分前沿模型。
此外,该公司还通过真实流量上的受控分析来补充线下测试,以捕捉那些评分器认为正确但实际体验不佳的回归问题。


相关链接:
Google 完成收购 Wiz,将加入 Google Cloud 运营 #20
Google LLC 正式完成对云安全平台 Wiz 的收购,Wiz 将加入 Google Cloud 但保持品牌独立运营。
Google LLC 宣布已完成对云及AI安全平台 Wiz 的收购。官方公告显示,Wiz 将加入 Google Cloud 并保留品牌,继续履行保护跨云环境客户的承诺。
此次收购旨在结合 Google Cloud 的AI基础设施优势与 Wiz 的云安全专长,打造统一安全平台。该平台将协助企业和政府机构在AI时代实现从代码到运行时的全流程防护,并能利用 AI模型 提前检测威胁。
秉承开放性承诺,Wiz 产品将继续支持 Amazon Web Services、Microsoft Azure 等主要云环境。

相关链接:
腾讯回应 OpenClaw 数据争议:称仅拉取 1GB 分担流量 #21
OpenClaw开发者Peter Steinberger指责腾讯未经授权抓取数据构建SkillHub。
腾讯回应称,该平台旨在解决中国访问延迟,仅从官方源拉取
1GB数据。
OpenClaw 开发者 Peter Steinberger 近日指责腾讯未经授权抓取 ClawHub 数据构建 "SkillHub"。
腾讯 AI 官方回应称,该平台系基于 OpenClaw 生态的本地化技能镜像,旨在解决中国用户访问延迟。
根据腾讯官方披露的数据,上线首周处理 180GB 流量(约 87 万次下载),仅从官方源拉取 1GB 数据。腾讯称团队成员是项目活跃贡献者,愿深化合作。

相关链接:
- https://www.aibase.com/zh/news/26172
- https://blog.openclaw.tech
- https://github.com/openclaw/openclaw
- https://github.com/openclaw/SkillHub
- https://x.com/PeterSteinberger/status/1767398201456199568
- https://github.com/tencentai/skillhub
智谱新模型启动内测,面向 Max 计划用户开放申请 #22
智谱在 Coding Plan 用户飞书群宣布,对代号 Pony-Alpha-2 的模型进行测试,Max套餐 用户可申请。
据用户透露,GLM-5-Code(代号 Pony-Alpha-2)已在官方飞书群面向用户启动内测,目前仅面向 GLM Coding Plan Max 套餐用户开放,相关订阅者现已获得该模型的访问权限。
针对该模型的具体技术细节、功能范围及正式上线时间,官方尚未发布正式公告,现有信息主要源于社区层面的反馈。

相关链接:
据传阿里 Qwen 后训练负责人郁博文加盟字节跳动 Seed 团队 #23
据媒体报道,原阿里通义实验室 Qwen 大模型“后训练”负责人 郁博文 已加盟字节跳动,出任 Seed 团队视觉模型与多模态交互团队“后训练”负责人。
据媒体报道,原阿里通义实验室 Qwen 大模型后训练负责人 郁博文 近日被曝加盟 字节跳动,出任 Seed 团队视觉模型与多模态交互团队后训练负责人,字节跳动 对此暂未回应。
英伟达计划五年投入 260 亿美元研发开放权重 AI 模型 #24
据报道,英伟达计划在未来五年投入约 260 亿美元研发“开放权重”AI 模型,这笔巨资将用于研发与算力建设,首批模型预计于 2026 年底发布。
据媒体报道及英伟达最新财务文件披露,英伟达计划在未来五年内投入约 260 亿美元研发和训练“开放权重”AI 模型,旨在推动公司从单纯的芯片供应商转型为全栈 AI 平台及前沿实验室。
该投资资金将在未来 18 至 24 个月内落实,覆盖研发、算力及人才建设,首批模型预计于 2026 年底或 2027 年初发布。
英伟达将采用公开权重但不一定完全开源的“开放权重”模式,并对自家硬件进行深度优化,以此加固 GPU 生态护城河。
目前该公司已预训练完成一个 5500 亿参数的超大模型。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。 This message is used to verify that this feed (feedId:249743826993702912) belongs to me (userId:236018819794813952). Join me in enjoying the next generation information browser https://folo.is.