AI 早报 2026-03-04

视频版：哔哩哔哩｜ YouTube

概览

模型发布

OpenAI发布GPT-5.3 Instant模型 ↗ #1
Google推出Gemini 3.1 Flash-Lite预览版 ↗ #2
xAI发布Grok 4.20 Beta 2模型更新 ↗ #3

开发生态

Anthropic推出Claude Code语音模式 ↗ #4
Codex 推出语音转写与ChatGPT app技能 ↗ #5
Codex 为部分Plus用户提供GPT-5.3-Codex-Spark ↗ #6
Codex 修复故障重置速率 ↗ #7
Cursor推出2.6版本，新增Agent交互界面 ↗ #8

产品应用

谷歌NotebookLM推出信息图自定义样式功能 ↗ #9
Grok更新视频延长功能至30秒 ↗ #10
阿里云宣布QoderWork全面开放 ↗ #11

技术与洞察

Arena.ai 上线 Document Arena 排行榜 ↗ #12
大语言模型在模拟核危机中被发现倾向升级冲突 ↗ #13

行业动态

阿里云Qwen核心团队骨干集中离职 ↗ #14
OpenAI核心研究员离职将加入Anthropic ↗ #15
美国最高法院拒绝受理AI版权上诉 ↗ #16
Anthropic披露Claude宕机因用户激增超过一倍 ↗ #17
OpenAI军合风波引发ChatGPT卸载激增 ↗ #18
Tabbit回应开源合规争议，移除翻译插件并开源代码 ↗ #19

前瞻与传闻

OpenAI预告5.4版本，或已现身用户端 ↗ #20

OpenAI发布GPT-5.3 Instant模型 `#1`

OpenAI 正式发布 GPT-5.3 Instant 模型。此次更新重点解决了模型过于谨慎和爱说教的痛点，同时将联网幻觉率降低了 26.8%。该模型现已向所有用户开放，Thinking 和 Pro 版本的更新也将于近期推出。

OpenAI近日发布 GPT-5.3 Instant 模型，替代 GPT-5.2 Instant。新版重点优化交互体验，减少了拒答、免责声明及说教语气，使对话更自然。其联网搜索增强了信息整合与语境理解能力。官方数据显示，该模型在医疗、法律等高风险领域的幻觉率显著降低，联网与非联网模式下分别下降 26.8% 和 19.7%。此外，模型提升了写作能力，但官方指出部分非英语语种回复仍显生硬。目前该模型已全量开放，前代模型将于 2026年6月 退役，Thinking及Pro版本更新即将推出。

相关链接：

https://openai.com/index/gpt-5-3-instant/

Google推出Gemini 3.1 Flash-Lite预览版 `#2`

Google 发布了 Gemini 3.1 Flash-Lite，该模型性能超越了 2.5 Flash，专为高频次、大规模工作负载设计，支持“思考等级”功能。根据官方数据，Gemini 3.1 Flash-Lite 的输出速度比 2.5 Flash 提升了 45%。

Google正式发布了Gemini 3.1 Flash-Lite，定位为Gemini 3系列中速度最快且最具成本效益的模型。该模型现已通过Google AI Studio的Gemini API及Vertex AI以预览版形式向开发者与企业开放，专为高频次、大规模工作负载设计。

性能方面，据Artificial Analysis基准测试，其首个回答token的时间比2.5 Flash快2.5倍，输出速度提升45%。在Arena.ai排行榜上，该模型获得1432的Elo分数，并在GPQA Diamond和MMMU Pro等基准测试中分别取得86.9%和76.8%的成绩，表现优于部分前代更大模型。Google高管Jeff Dean指出，该模型在效率和能力上设立了新标准。

定价方面，其成本效益显著。官方定价为每百万输入token 0.25美元、每百万输出token 1.50美元。该模型引入的“思考等级”功能，允许开发者动态控制模型在不同任务上的推理深度，以实现自适应智能。其应用场景广泛，包括大规模翻译、内容审核、用户界面生成及模拟创建等。

相关链接：

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

xAI发布Grok 4.20 Beta 2模型更新 `#3`

xAI 发布了 Grok 4.20 Beta 2 版本，提升了指令跟随能力并减少了模型幻觉，同时优化了对 LaTeX 的支持。新版本还提高了图像搜索触发的精准度以及多图像渲染的稳定性。

xAI 旗下 Grok 模型近日发布 Grok 4.20 Beta 2 版本更新。官方说明显示，此次升级优化了模型性能与功能稳定性。核心改进包括：显著提升指令跟随能力，减少了模型“能力幻觉”；增强科学文本生成质量，特别是对 LaTeX 表达的支持；提高图像搜索触发的精准度，并强化了多图像渲染的稳定性与可靠性。

相关链接：

https://x.com/grok/status/2028714422462448041

Anthropic推出Claude Code语音模式 `#4`

Claude Code 推出 Voice mode，按住空格键或输入 voice 斜杠指令激活。该功能目前正陆续向 Pro、Max 及企业版用户开放，不收取额外费用，但目前仅支持英文。

Anthropic旗下开发工具 Claude Code 正式推出 Voice mode 语音模式。该功能正陆续向 Pro、Max、Team 及 Enterprise 版用户开放，首批仅覆盖约 5% 用户，预计几周内完成全面推送。获权用户通过欢迎屏提示或输入 /voice 指令即可启用。

功能采用 Push-to-Talk 机制，用户按住空格键说话，松开后文本即流式插入光标处，支持语音与键盘混合输入。官方明确该功能不额外收费，且转录 Token 不计入速率限制。目前仅支持英文。

相关链接：

https://x.com/trq212/status/2028628570692890800

Codex 推出语音转写与ChatGPT app技能 `#5`

OpenAI 宣布向所有 Codex 用户开放语音转写功能，App 端可通过 Ctrl 加 M 快捷键激活，CLI 端则需在配置文件开启实验选项后长按空格键使用。此外，平台新增了 **$chatgpt-apps** 技能，帮助开发者构建 ChatGPT app。

OpenAI 开发者生态近期针对 Codex 平台推出两项更新。

首先，官方确认 Voice transcription（语音转写）功能现已面向 100% 用户开放。App 端支持麦克风按钮或 Ctrl + M 激活；CLI 端目前为实验性功能，需在 ~/.codex/config.toml 配置开启，通过长按空格键交互。据社区反馈，部分 Linux 用户报告遭遇 403 错误。

其次，官方发布全新的 $chatgpt-apps skill。该技能专为基于 Apps SDK 的开发者设计，旨在协助快速搭建项目脚手架、连接工具与小部件资源，并在 ChatGPT 环境内迭代开发具备宿主感知能力的 UI 界面。

相关链接：

Codex 为部分Plus用户提供GPT-5.3-Codex-Spark `#6`

Codex 团队宣布向使用 Codex 最多的 ChatGPT Plus 用户开放 GPT-5.3-Codex-Spark 的使用权限，有效期至本月 20 日。

OpenAI Codex团队宣布向使用 Codex 最多的 ChatGPT Plus 用户开放 GPT-5.3-Codex-Spark 模型体验权限。体验期至本月 20日，无需额外付费。

相关链接：

https://x.com/ah20im/status/2028638828345659518

Codex 修复故障重置速率 `#7`

北京时间3月3日早上，Codex 团队宣布修复导致服务中断的基础设施故障，并为所有用户重置了速率限制。

北京时间3月3日早上，OpenAI的Codex团队宣布修复一个导致服务中断的基础设施问题。服务已全面恢复运行并为所有用户重置速率限制。

相关链接：

https://x.com/romainhuet/status/2028651795459997826

Cursor推出2.6版本，新增Agent交互界面 `#8`

Cursor 正式发布 2.6 版本，核心亮点在于引入 MCP 应用，使 Agent 能在对话中直接渲染 Figma 设计图或 Amplitude 图表等交互式界面。

Cursor 发布 2.6 版本更新，正式引入 MCP 应用功能，允许 Agent 在对话中渲染 Amplitude 图表、Figma 设计图及 tldraw 白板等交互式界面。该特性通过解析 JSON 展示 HTML，优化了交互体验。此外，版本面向 Teams 和企业套餐推出团队插件市场，支持管理员在内部共享并集中治理私有插件。同时，本次更新还改进了调试模式等核心能力。

相关链接：

谷歌NotebookLM推出信息图自定义样式功能 `#9`

谷歌 NotebookLM 正式上线信息图自定义样式功能，新增 10 种预设风格并支持深度定制。用户可利用最新 Model 能力，将复杂源素材一键转化为高颜值、易阅读的视觉信息图。

谷歌旗下AI笔记工具 NotebookLM 正式推出信息图自定义样式功能并已上线。该功能提供10种预设样式（如编辑、黏土、砖块及可爱风格），并支持完全自定义编辑。用户只需在 Studio 面板中点击编辑按钮，即可借助最新的 Gemini 模型能力，一键将复杂源素材转化为视觉效果出色的信息图，旨在降低高质量视觉内容的制作门槛，适用于学习总结与知识分享等场景。

相关链接：

https://x.com/NotebookLM/status/2028556861050630632

Grok更新视频延长功能至30秒 `#10`

Grok 的 Imagine Extend Video 功能现已支持生成长达 30 秒的视频。

Grok Imagine Extend Video 功能迎来更新，视频生成时长上限现已延长至最长30秒。据社区用户反馈，该官方生成方案在视频契合度、配乐连续度及NSFW内容处理上，均显著优于此前手动截帧拼接的方式。

相关链接：

https://x.com/techdevnotes/status/2028706608704827671

阿里云宣布QoderWork全面开放 `#11`

阿里桌面Agent产品 QoderWork 现已全面开放，支持 Mac 和 Windows 双端，用户官网下载即可零部署使用。

阿里云宣布桌面Agent产品 QoderWork 全面开放，提供Mac及Windows双版本，用户官网下载即可使用，无需额外部署。该产品集成顶尖模型，将 Agent 能力延伸至文件整理、数据处理等日常场景，支持自主拆解复杂意图。新版新增模型分级选择器，分设降低成本的标准档与强推理的旗舰档，并内置技能广场及保障隐私的沙盒环境。

相关链接：

https://mp.weixin.qq.com/s/wAmZpqeOK4_DBO9yEvJEXQ

Arena.ai 上线 Document Arena 排行榜 `#12`

Arena 上线 Document Arena 排行榜，利用用户上传的真实 PDF 评估 AI 模型的文档推理能力。目前 Claude Opus 4.6 位居榜首。

Arena.ai 宣布 Document Arena 正式上线。该平台基于用户上传的真实 PDF 文件进行并列评估，旨在衡量前沿 AI 模型 的文档推理能力。最新榜单显示，Claude Opus 4.6 以 1525 分位居第一，领先第二名 51 分。

相关链接：

https://x.com/arena/status/2028930446235713877

大语言模型在模拟核危机中被发现倾向升级冲突 `#13`

一篇近期发布的研究表明，GPT-5.2等模型在核危机模拟中展现出复杂的欺骗与推理能力，在 95% 的模拟情境下，这些模型倾向于升级冲突甚至动用核武器。

伦敦国王学院教授 Kenneth Payne 近期在 arXiv 发布《AI Arms and Influence》研究，选取 GPT-5.2、Claude Sonnet 4 及 Gemini 3 Flash 三款模型进行核危机模拟。实验显示，模型具备欺骗意图、心智理论等复杂战略推理能力。在 95% 的情境下，模型倾向于升级冲突甚至使用核武器，且无一选择妥协。研究强调，AI 虽是强大的战略分析工具，但其决策逻辑与人类存在巨大差异，需深入理解以应对其在战略决策中的影响。

相关链接：

https://arxiv.org/abs/2602.14740

阿里云Qwen核心团队骨干集中离职 `#14`

Qwen模型团队遭遇重大人事变动，原负责人林俊旸及多名核心骨干已确认离职。业界对离职员工表示祝福，同时普遍担忧这一变化可能导致Qwen停止交付前沿开源模型，转而走向封闭的商业化路线，Qwen Chat和Qwen Code等项目也可能受到重大影响。据社交媒体上流传的消息，此次变动源于阿里云调整基础模型团队的考核标准，引入日活指标并更换了管理层。

Qwen模型团队林俊旸在X平台宣布卸任，其他多名核心骨干也确认离职。此次人事变动发生于Qwen3.5系列所有模型发布后次日。业界对离职员工表示祝福，同时担忧此次动荡将导致Qwen团队转向封闭商业化路线，从而停止交付前沿开源模型。Qwen Chat 和 Qwen Code 等项目可能也会受到重大影响。据社交媒体上流传的消息，此次离职并非出于当事人意愿，主要涉及阿里云对基础模型团队考核方式的调整（如引入DAU指标）及管理层变动。

相关链接：

OpenAI核心研究员离职将加入Anthropic `#15`

OpenAI 推理模型核心研究员 Max Schwarzer 宣布离职，并加入 Anthropic 回归强化学习研究。他此前主导了 o1、o3 以及 GPT-5 系列的后训练工作。

OpenAI 推理模型核心研究员 Max Schwarzer 宣布离职，下一站将加入 Anthropic。作为 o1 早期参与者，他主导了 o1 和 o3 的后训练工作，并在过去一年领导团队交付了 GPT-5、5.1、5.2 及 5.3-Codex。Schwarzer 表示，离职是为了回归一线研究，不再担任管理职务，并计划在 Anthropic 专注于强化学习研究。尽管他感谢了 OpenAI 管理层。

相关链接：

https://x.com/max_a_schwarzer/status/2028939154944585989

美国最高法院拒绝受理AI版权上诉 `#16`

据报道，美国最高法院正式拒绝受理 Stephen Thaler 关于 AI生成作品 版权资格的上诉，维持了纯 AI生成作品 无法获得版权保护的原判。

据路透社报道，美国最高法院拒绝受理 Stephen Thaler 的上诉，维持下级法院判决，确认纯 AI 生成作品无法获得版权保护。泰勒曾为其 AI 系统 DABUS 独立创作的作品申请版权，但美国版权局及法院一致认定，“人类作者身份”是版权保护的基石。尽管 Thaler 律师团队警告此举将冲击 AI 产业，但法院坚持仅基于算法独立生成的作品不具备版权资格，除非包含足够的人类独创性贡献。

相关链接：

https://www.reuters.com/legal/government/us-supreme-court-declines-hear-dispute-over-copyrights-ai-generated-material-2026-03-02/

Anthropic披露Claude宕机因用户激增超过一倍 `#17`

近日，Claude因“空前需求”连续发生服务中断。Anthropic官方将此归因于“前所未有的需求”导致服务器过载，并披露免费用户自1月增长超60%，付费用户自去年10月翻倍。

近日，Claude 连续遭遇大规模服务中断，导致 claude.ai、移动应用及 Claude Code 等消费级服务连接失败。Anthropic 官方将此归因于“前所未有的需求”导致服务器过载，并披露免费用户自 1月增长超 60%，付费用户自去年 10月 翻倍。据彭博社报道，此次需求激增或与 OpenAI 与美国战争部合作引发用户反弹有关，Claude 在美下载量一度超越 ChatGPT。

相关链接：

http://status.claude.com

OpenAI军合风波引发ChatGPT卸载激增 `#18`

OpenAI 与美国战争部合作的消息引发剧烈反弹，2 月 28 日其美国移动端卸载量环比激增 295%，差评飙升 775%。为应对信任危机，OpenAI 紧急修订协议明确禁止 AI 用于美国国内监控。

受 OpenAI 与美国国防部合作影响，ChatGPT 遭遇显著用户流失。据 Sensor Tower 数据，其美区移动端单日卸载量环比激增 295%，一星差评飙升 775%。相反，Anthropic 因拒绝军方合作，旗下 Claude 下载量激增并登顶美区 App Store。面对危机，OpenAI CEO Altman 转发内部贴文，称已修订协议明确禁止 AI 用于美国公民监控及情报机构使用，并承认发布沟通存在失误。同时，舆论引发大量用户利用 Prompt 提取“用户画像”迁移至新平台。

相关链接：

https://x.com/sama/status/2028640354912923739

Tabbit回应开源合规争议，移除翻译插件并开源代码 `#19`

针对 Tabbit 浏览器翻译插件涉开源合规争议，Tabbit 团队回应称，已与作者达成共识。作为补救，Tabbit 已从新版浏览器移除该插件，并将修改后的代码完整开源，后续计划获取正式授权并升级内部审查流程。

针对 Tabbit 浏览器翻译插件使用开源项目 read-frog 引发的合规争议，Tabbit 团队回应称已与原作者达成共识。官方表示，去年底 fork 该项目时原仓库未含协议，虽原作者随后添加 GPLv3，但团队因未合并代码未及时关注。Tabbit 承认调研不充分，决定从新版浏览器移除该插件，并将修改后代码完整开源至 GitHub。团队计划获正式授权后恢复功能，并承诺升级内部审查流程，明确标识开源项目 License。

相关链接：

https://github.com/Tabbit-Browser/read-frog

OpenAI预告5.4版本，或已现身用户端 `#20`

OpenAI 官方预告 GPT-5.4 版本即将发布，有用户反馈称，目前 ChatGPT Pro 网页端疑似已悄然部署该模型，其在 SVG 矢量绘图方面的细节处理能力表现出色。

OpenAI 官方近日预告称“5.4版本比你想象的要来得更早”。据社区用户反馈，ChatGPT Pro（Web）端疑似已悄然部署该新模型。多位用户测试表示，该模型在 SVG 矢量图生成方面细节处理能力极强，能生成高度精细的复杂图像，但文件体积巨大且推理耗时较长，有用户记录生成时间约为 32 至 45 分钟。

相关链接：

提示：内容由AI辅助创作，可能存在幻觉和错误。

Contents

AI 早报 2026-03-04

概览

模型发布

开发生态

产品应用

技术与洞察

行业动态

前瞻与传闻

OpenAI发布GPT-5.3 Instant模型 #1

Google推出Gemini 3.1 Flash-Lite预览版 #2

xAI发布Grok 4.20 Beta 2模型更新 #3

Anthropic推出Claude Code语音模式 #4

Codex 推出语音转写与ChatGPT app技能 #5

Codex 为部分Plus用户提供GPT-5.3-Codex-Spark #6

Codex 修复故障重置速率 #7

Cursor推出2.6版本，新增Agent交互界面 #8

谷歌NotebookLM推出信息图自定义样式功能 #9

Grok更新视频延长功能至30秒 #10

阿里云宣布QoderWork全面开放 #11

Arena.ai 上线 Document Arena 排行榜 #12

大语言模型在模拟核危机中被发现倾向升级冲突 #13

阿里云Qwen核心团队骨干集中离职 #14

OpenAI核心研究员离职将加入Anthropic #15

美国最高法院拒绝受理AI版权上诉 #16

Anthropic披露Claude宕机因用户激增超过一倍 #17

OpenAI军合风波引发ChatGPT卸载激增 #18

Tabbit回应开源合规争议，移除翻译插件并开源代码 #19

OpenAI预告5.4版本，或已现身用户端 #20

OpenAI发布GPT-5.3 Instant模型 `#1`

Google推出Gemini 3.1 Flash-Lite预览版 `#2`

xAI发布Grok 4.20 Beta 2模型更新 `#3`

Anthropic推出Claude Code语音模式 `#4`

Codex 推出语音转写与ChatGPT app技能 `#5`

Codex 为部分Plus用户提供GPT-5.3-Codex-Spark `#6`

Codex 修复故障重置速率 `#7`

Cursor推出2.6版本，新增Agent交互界面 `#8`

谷歌NotebookLM推出信息图自定义样式功能 `#9`

Grok更新视频延长功能至30秒 `#10`

阿里云宣布QoderWork全面开放 `#11`

Arena.ai 上线 Document Arena 排行榜 `#12`

大语言模型在模拟核危机中被发现倾向升级冲突 `#13`

阿里云Qwen核心团队骨干集中离职 `#14`

OpenAI核心研究员离职将加入Anthropic `#15`

美国最高法院拒绝受理AI版权上诉 `#16`

Anthropic披露Claude宕机因用户激增超过一倍 `#17`

OpenAI军合风波引发ChatGPT卸载激增 `#18`

Tabbit回应开源合规争议，移除翻译插件并开源代码 `#19`

OpenAI预告5.4版本，或已现身用户端 `#20`