AI 早报 2026-03-13

视频版哔哩哔哩YouTube

概览

要闻

  • GitHub 调整 Copilot 学生计划,取消 GPT-5.4 等模型自选权限 #1
  • Claude 支持生成式 UI,聊天界面构建交互式图表 #2

模型发布

  • OpenAI 视频 API 上线新功能 #3
  • NVIDIA 发布 NVILA-8B-HD-Video 模型,支持 4K 视频输入 #4

开发生态

  • Claude Code 推出语音模式,引入设置脚本功能 #5
  • Google 调整 Antigravity 计费,Pro 刷新周期延至 7 天 #6
  • Google Gemini API 现可设置消费上限 #7
  • OpenRouter 上线 Auto Exacto 降低工具调用错误率 #8
  • Hermes Agent v0.2.0 发布,支持多 IDE 集成 #9
  • 斯坦福大学开源 OpenJarvis 框架支持本地优先个人 AI #10

产品应用

  • 谷歌地图集成 Gemini 推出十多年来最大规模升级 #11
  • xAI 发布 Grok 新视频功能,支持 7 张参考图转视频 #12
  • 微软推出 Copilot Health 整合设备与健康记录数据 #13
  • OpenClaw 生态密集更新,百度联想阶跃发布新服务 #14
  • Perplexity 向Pro 用户开放 Perplexity Computer #15
  • 淘宝 PC 端支持 MCP,可接入OpenClaw #16
  • ComfyUI 发布 App Mode 及 ComfyHub 支持工作流分享 #17
  • Canva 推出 Magic Layers 支持平面图转多层可编辑 #18

技术与洞察

  • Cursor 发布 CursorBench 评测体系,优化 Agent 编程评估 #19

行业动态

  • Google 完成收购 Wiz,将加入 Google Cloud 运营 #20
  • 腾讯回应 OpenClaw 数据争议:称仅拉取 1GB 分担流量 #21
  • 智谱新模型启动内测,面向 Max 计划用户开放申请 #22

前瞻与传闻

  • 据传阿里 Qwen 后训练负责人郁博文加盟字节跳动 Seed 团队 #23
  • 英伟达计划五年投入 260 亿美元研发开放权重 AI 模型 #24

GitHub 调整 Copilot 学生计划,取消 GPT-5.4 等模型自选权限 #1

GitHub 宣布即日起调整 Copilot 学生计划,不再支持学生自主选择 GPT-5.4Claude Opus 等高级模型。

GitHub Education Team 宣布调整 Copilot 学生计划。官方称,为确保全球近 200 万 学生持续获得免费服务,即日起该计划不再支持用户自主选择 GPT-5.4Claude OpusClaude Sonnet 等高级模型。

但认证学生免费访问权限、学术验证状态及高级请求单位配额保持不变。

相关链接:


Claude 支持生成式 UI,聊天界面构建交互式图表 #2

Claude 上线了原生交互式图表功能,以 Beta 形式向包括免费版在内的所有订阅计划开放。

用户可在对话中直接阅读解释并即时交互可视化内容。

Anthropic 官方宣布,Claude 现已支持在聊天界面构建交互式图表与示意图。该功能被称为 "Generative UI",通过内嵌 Visualizer 组件实现,目前以 Beta 形式向所有订阅计划开放。

官方人员称,与 Artifact 不同,Visualizer 存在于对话流中,允许用户即时交互,而非独立交付物。

相关链接:


OpenAI 视频 API 上线新功能 #3

OpenAI 更新 Video API,提供由 Sora 2 驱动的自定义角色与对象、最长 20秒 视频生成、场景延续及批量处理等核心功能。

OpenAI Developers 官方宣布在 Video API 中面向所有开发者全量上线由 Sora 2 驱动的新功能。

此次更新核心特性包括:支持自定义角色和对象、16:99:16 比例导出、生成长达 20 秒 的视频片段、用于扩展场景的视频延续功能,以及批量视频生成任务。

相关链接:


NVIDIA 发布 NVILA-8B-HD-Video 模型,支持 4K 视频输入 #4

NVIDIA 开源了 NVILA-8B-HD-Video 多模态大模型,专门处理 4K 分辨率、千帧级别的高清长视频。

核心亮点是 AutoGaze 技术,能把视频 Token 压缩 100 倍,推理延迟最高降低 19 倍。

HLVid 长视频基准测试上,该模型达到业界最优。

NVIDIA 在 Hugging Face 发布 NVILA-8B-HD-Video 模型。这是一款 8B 参数多模态大语言模型,专为高分辨率长视频理解设计。

该模型支持 4K 分辨率和 1K 帧视频输入,集成 AutoGaze 技术。官方数据显示,该技术可将视频 Token 数量减少最多 100 倍,ViT 和 LLM 延迟分别降低最多 19 倍和 10 倍。

模型在 VideoMME 基准测试中性能提升,并在 HLVid 基准上达到 SOTA 水平。

该模型基于 NVILA-Lite-8B 开发,采用 CC-BY-NC-SA-4.0 许可协议,仅限研发使用。

相关链接:


Claude Code 推出语音模式,引入设置脚本功能 #5

ClaudeClaude Code 桌面端及 Cowork 平台上线了语音模式。此外,Claude Code Web 端和桌面端新增设置脚本功能,支持在云端环境启动前自动完成依赖安装与配置。

Claude Code 近期宣布推出语音模式,该功能现已正式支持桌面端及 Cowork 平台,进一步丰富了用户的交互方式。

此外,该工具面向 Web 端和桌面端引入了设置脚本功能。通过添加设置脚本,用户能够在云端环境启动之前,自动化完成环境配置工作。根据官方说明,这项功能对于安装依赖项、调整系统设置以及管理配置文件等场景尤为实用,有效提升了开发环境的初始化效率。

相关链接:


Google 调整 Antigravity 计费,Pro 刷新周期延至 7 天 #6

Antigravity应用正式调整计费规则,从单一配额制改为“固定配额加AI积分”的混合模式。

Pro用户配额刷新周期从5小时延长至7天,每月获赠1000积分;

Ultra用户保持5小时刷新,拥有约25000积分。

Google旗下 Antigravity 应用近期调整计费模式,确立了“固定配额+AI Credit”体系,积分消耗依据 Vertex API 定价计算。

在权益方面,AI Pro 用户配额刷新周期改为7天,每月获赠 1000点 积分(约 10美元);据称 Ultra 用户则保留5小时刷新机制,并拥有约 25000至26000点 积分(约 250美元),该积分支持家庭组共享。

目前,Antigravity 已在设置中新增可视化仪表盘,用户需手动开启“AI积分超额使用”选项,方可在基准配额耗尽后自动抵扣积分。

若有额外需求,官方支持购买更多 AI Credit


Google Gemini API 现可设置消费上限 #7

Google 宣布 Gemini API 正式支持消费上限功能,开发者即日起可通过 AI Studio 在项目层级设置额度以管控成本。

需特别注意的是,配置生效最长存在 10 分钟 延迟,且目前暂不支持 Vertex AI 及代码端设置。

Gemini API 现已正式支持 "Spend caps"(消费上限)功能。即日起,开发者可通过 AI Studio 设置该上限,以在构建应用时获得更高的成本控制权。

根据官方说明,该功能目前仅支持在 UI 界面设置,且作用于 Project(项目)层级而非 API Key 层级;上限设置后可能存在最长 10 分钟 的延迟才能生效,期间产生的超额费用仍需由用户承担。

此外,官方正计划移除原有的 10 美元 一次性预付款要求,并将整个 API 转向预付费模式。

相关链接:


OpenRouter 上线 Auto Exacto 降低工具调用错误率 #8

OpenRouter 宣布推出自适应质量路由机制 Auto Exacto,默认用于工具调用请求。该系统通过整合吞吐量与数十亿次工具调用遥测数据,每 5分钟 动态评估,能够有效降低模型工具调用错误率。

OpenRouter 正式宣布推出 “Auto Exacto” 功能,这是一种自适应质量路由机制,目前已针对所有包含工具调用(tool-calling)的请求默认启用。

该系统通过整合吞吐量、工具调用遥测数据以及 TauBench Verified AirlineGPQA-Diamond 等基准测试分数这三大信号,大约每 5 分钟 对供应商进行一次重新评估,旨在解决新模型发布初期供应商表现差异巨大的问题。

根据官方提供的数据,在过去几天中,这一新算法将不同模型的工具调用错误率降低了 15% 至 90%

对于非工具调用请求,用户可以通过在任意模型标识后附加 :exacto 来启用该质量加权路由,该功能运作方式类似于现有的 :nitro:floor 后缀。

相关链接:


Hermes Agent v0.2.0 发布,支持多 IDE 集成 #9

NousResearch 正式发布了 Hermes Agent v0.2.0,该版本通过集成 MCP 客户端与 ACP 服务器,实现了与 VS CodeJetBrains 的无缝连接,并将 智谱 GLMKimiMiniMax 纳入原生支持体系。

NousResearch 正式发布 Hermes Agent v0.2.0。据官方社交账号显示,该项目两周内汇聚 63 位贡献者,合并 216 个 PR,提交超 1200 次。

该版本核心提升互操作性,搭载 MCP 客户端并内置 ACP 服务器,允许 VS Code 等编辑器作为前端。模型原生支持 智谱,兼容 KimiMiniMaxOpenAI OAuth

安全上引入文件系统检查点与 /rollback 机制,利用 git worktree 实现并行任务隔离。工具层面集成无需 API Key 的本地无头 Chromium 浏览器,增强子 Agent 透明度。

技能库扩展至 15 个类别的 70 多项,涵盖 Solana 区块链及 Google Workspace 等领域。

相关链接:


斯坦福大学开源 OpenJarvis 框架支持本地优先个人 AI #10

斯坦福大学研究人员推出了开源框架 OpenJarvis,旨在构建默认在本地运行、仅在必要时调用云端的个人 AI 系统。

斯坦福大学的研究人员推出了 OpenJarvis,这是一个专为构建本地优先个人 AI 而设计的开源框架。该项目旨在让个人 AI 默认在本地设备上运行,仅在必要时调用云端资源。

OpenJarvis 构建于五大原语之上,涵盖了从模型层、推理引擎到 Agent 行为、工具与记忆以及闭环学习的完整技术栈,支持 MCPGoogle A2A 等协议,并集成了针对能耗、延迟及成本的一流评估指标。

该框架兼容 OllamavLLM 等多种推理后端,提供 Python SDK、CLI 及桌面端应用。

相关链接:


谷歌地图集成 Gemini 推出十多年来最大规模升级 #11

Google Maps 宣布推出重大升级,通过集成 Gemini 模型,上线了对话式探索功能 “Ask Maps” 和视觉革新的 “Immersive Navigation”

Google Maps 宣布迎来十多年来最大规模升级,集成 Gemini 模型推出两项核心功能。

Ask Maps 支持自然语言查询和个性化行程规划,利用超 3 亿 地点和 5 亿 社区贡献者数据提供建议,现已在美印移动端上线。

Immersive Navigation 重构驾驶体验,提供含丰富道路细节的 3D 视图、自然语音引导及实时路况预警。该功能即日起在美国推出,未来数月将扩展至多平台及车机系统。

相关链接:


xAI 发布 Grok 新视频功能,支持 7 张参考图转视频 #12

xAI 团队为 Grok Imagine 上线了全新的“图生视频”功能,最新版本支持上传最多 7 张任意元素的参考图,即可生成画面流畅且特征一致的视频。

xAI 团队成员 Ethan He 宣布,Grok Imagine 正式推出 reference-to-video 功能。

用户更新应用后,可上传最多 7 张包含角色或物体等元素的参考图,转化为视频。

据其描述,该技术能生成流畅一致的群组场景,确保角色特征真实。

相关链接:


微软推出 Copilot Health 整合设备与健康记录数据 #13

Microsoft 推出了 Copilot Health,这是一个具备医疗智能的独立安全空间,支持连接 Apple Health 等五十多种可穿戴设备及电子病历,提供基于权威来源的问答服务和医生匹配。

Microsoft 正式推出 Copilot Health,作为 Copilot 内部独立安全空间。该功能支持连接 Apple Health 等 50 多种可穿戴设备,通过 HealthEx 接入超 5 万家美国医疗机构电子健康记录,并整合 Function 实验室检测结果。

其提供基于权威来源且附带引用的问答服务,并提供医生寻找服务。为确保隐私,对话数据与通用 Copilot 隔离且绝不用于模型训练,已获得 ISO/IEC 42001 认证。

现面向美国 18 岁及以上用户开启英文版的等待名单,计划扩展至全球。官方强调该服务不用于诊断或替代专业医疗建议。

相关链接:


OpenClaw 生态密集更新,百度联想阶跃发布新服务 #14

OpenClaw发布新版,修复了编程Bug并支持Hunter Alpha等模型。 阶跃星辰上线云端Agent服务StepClaw,已开放5万个免费名额。 百度推出手机端应用红手指Operator联想则宣布将在小新YOGA平板首发本地化的PadClaw技术。

OpenClaw 发布新版本,官方称支持 Hunter Alpha 等模型并修复 Bug,显著提升了编程性能。

阶跃星辰推出云端 Agent 服务 StepClaw,用户可一键部署并实现 7x24 小时云端运行,官方宣布开放 5 万个免费体验名额。

百度发布全球首款手机龙虾应用红手指 Operator,支持通过自然语言指令操控手机 App 执行任务。

联想宣布将在小新及 YOGA 系列平板上首发端侧一键部署 PadClaw 技术,强调本地化运行优势。

更多细节预计将在近期发布会上揭晓。

相关链接:


Perplexity 向Pro 用户开放 Perplexity Computer #15

Perplexity 宣布 Perplexity Computer 正式面向 Pro 用户开放,该产品集成了二十多种先进模型与数百个连接器,支持自定义技能。

Perplexity 宣布,Perplexity Computer 正式面向 Pro 订阅用户开放。该产品集成了 20 多种先进模型,支持使用预置与自定义技能及数百个连接器,旨在提供更强大的处理能力。

针对此次发布,官方推出了相应的额度奖励政策。目前所有 Pro 用户均可获得 4000 个奖励额度。此外,Max 订阅用户相比 Pro 用户享有更高的消费限额及每月 10000 个循环额度。


淘宝 PC 端支持 MCP,可接入OpenClaw #16

据用户发现,淘宝桌面版现已支持 MCP 协议,并可通过 OpenClaw 实现一键配置。

据社区用户反馈,淘宝桌面版(pc.taobao.com)现已支持 MCP 协议,并可通过 OpenClaw 实现一键配置。该功能使得各大 AI 工具能够调用 taobao-native 工具集,提供搜索商品、加入购物车、扫描页面元素及输入文本等接口。

相关链接:


ComfyUI 发布 App Mode 及 ComfyHub 支持工作流分享 #17

ComfyUI官方推出全新工具系统,让任何工作流都能变成可分享的应用程序。核心功能包括 App ModeApp Builder 和可分享URL,接收方无需安装就能在浏览器里直接运行。

同时上线的 ComfyHub 预览版是一个社区分享平台,方便用户快速找到即用型工作流。

ComfyUI 官方宣布推出包含 App ModeApp BuilderURL 分享ComfyHub 的工具系统,旨在将工作流转化为无需节点图经验的应用程序。

App Mode 隐藏复杂节点,据称对移动端友好;App Builder 允许精确配置参数;通过 URL 分享,接收方可免安装直接运行。

同时,社区平台 ComfyHub 预览版已上线,供用户浏览精选工作流。

目前,核心功能已在 Comfy CloudComfy Local 上线,后者还针对 NVIDIA RTX 5090AMD RX 9070 XT 等最新 GPU 进行了优化。

相关链接:


Canva 推出 Magic Layers 支持平面图转多层可编辑 #18

Canva 推出 Magic Layers 新功能,能把平面图片和 AI 生成的视觉效果变成多层可编辑设计。

用户不用重新生成,就能单独调整对象、文字等细节。

Canva 近日宣布推出 Magic Layers 功能,该功能现已在美、英、加、澳四国进入公开测试阶段。

据官方介绍,此功能可将平面图片及 AI 生成的视觉效果转化为多层、完全可编辑的设计。

用户在保留原始布局的前提下,可单独选择并编辑对象、文本框等组件。

相关链接:


Cursor 发布 CursorBench 评测体系,优化 Agent 编程评估 #19

Cursor 官方发布了名为 CursorBench 的混合评测体系,利用内部真实开发会话构建离线评测,并结合线上受控实验,以解决公开基准存在的数据污染和任务失真问题。

Cursor 近日分享了针对智能体编程任务的模型评分新方法,采用线上与线下结合的混合评测流程,以确保对模型质量的判断始终与开发者的真实工作方式保持一致。

其内部离线评测套件 CursorBench 基于工程团队的真实会话构建,而非公开代码仓库,有效解决了公开基准在一致性、评分逻辑及数据污染方面的局限性。

最新版本的 CursorBench-3 任务规模较初版翻倍,覆盖多工作区环境等复杂场景,官方数据显示其能更好地区分前沿模型。

此外,该公司还通过真实流量上的受控分析来补充线下测试,以捕捉那些评分器认为正确但实际体验不佳的回归问题。

相关链接:


Google 完成收购 Wiz,将加入 Google Cloud 运营 #20

Google LLC 正式完成对云安全平台 Wiz 的收购,Wiz 将加入 Google Cloud 但保持品牌独立运营。

Google LLC 宣布已完成对云及AI安全平台 Wiz 的收购。官方公告显示,Wiz 将加入 Google Cloud 并保留品牌,继续履行保护跨云环境客户的承诺。

此次收购旨在结合 Google Cloud 的AI基础设施优势与 Wiz 的云安全专长,打造统一安全平台。该平台将协助企业和政府机构在AI时代实现从代码到运行时的全流程防护,并能利用 AI模型 提前检测威胁。

秉承开放性承诺,Wiz 产品将继续支持 Amazon Web ServicesMicrosoft Azure 等主要云环境。

相关链接:


腾讯回应 OpenClaw 数据争议:称仅拉取 1GB 分担流量 #21

OpenClaw开发者Peter Steinberger指责腾讯未经授权抓取数据构建SkillHub

腾讯回应称,该平台旨在解决中国访问延迟,仅从官方源拉取 1GB 数据。

OpenClaw 开发者 Peter Steinberger 近日指责腾讯未经授权抓取 ClawHub 数据构建 "SkillHub"。

腾讯 AI 官方回应称,该平台系基于 OpenClaw 生态的本地化技能镜像,旨在解决中国用户访问延迟。

根据腾讯官方披露的数据,上线首周处理 180GB 流量(约 87 万次下载),仅从官方源拉取 1GB 数据。腾讯称团队成员是项目活跃贡献者,愿深化合作。

相关链接:


智谱新模型启动内测,面向 Max 计划用户开放申请 #22

智谱在 Coding Plan 用户飞书群宣布,对代号 Pony-Alpha-2 的模型进行测试,Max套餐 用户可申请。

据用户透露,GLM-5-Code(代号 Pony-Alpha-2)已在官方飞书群面向用户启动内测,目前仅面向 GLM Coding Plan Max 套餐用户开放,相关订阅者现已获得该模型的访问权限。

针对该模型的具体技术细节、功能范围及正式上线时间,官方尚未发布正式公告,现有信息主要源于社区层面的反馈。

相关链接:


据传阿里 Qwen 后训练负责人郁博文加盟字节跳动 Seed 团队 #23

据媒体报道,原阿里通义实验室 Qwen 大模型“后训练”负责人 郁博文 已加盟字节跳动,出任 Seed 团队视觉模型与多模态交互团队“后训练”负责人。

据媒体报道,原阿里通义实验室 Qwen 大模型后训练负责人 郁博文 近日被曝加盟 字节跳动,出任 Seed 团队视觉模型与多模态交互团队后训练负责人,字节跳动 对此暂未回应。


英伟达计划五年投入 260 亿美元研发开放权重 AI 模型 #24

据报道,英伟达计划在未来五年投入约 260 亿美元研发“开放权重”AI 模型,这笔巨资将用于研发与算力建设,首批模型预计于 2026 年底发布。

据媒体报道及英伟达最新财务文件披露,英伟达计划在未来五年内投入约 260 亿美元研发和训练“开放权重”AI 模型,旨在推动公司从单纯的芯片供应商转型为全栈 AI 平台及前沿实验室。

该投资资金将在未来 18 至 24 个月内落实,覆盖研发、算力及人才建设,首批模型预计于 2026 年底2027 年初发布。

英伟达将采用公开权重但不一定完全开源的“开放权重”模式,并对自家硬件进行深度优化,以此加固 GPU 生态护城河。

目前该公司已预训练完成一个 5500 亿参数的超大模型。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误。 This message is used to verify that this feed (feedId:249743826993702912) belongs to me (userId:236018819794813952). Join me in enjoying the next generation information browser https://folo.is.