2026-03-04

AI 早报 2026-03-04
概览
模型发布
开发生态
- Anthropic推出Claude Code语音模式 ↗
#4 - Codex 推出语音转写与ChatGPT app技能 ↗
#5 - Codex 为部分Plus用户提供GPT-5.3-Codex-Spark ↗
#6 - Codex 修复故障重置速率 ↗
#7 - Cursor推出2.6版本,新增Agent交互界面 ↗
#8
产品应用
技术与洞察
行业动态
- 阿里云Qwen核心团队骨干集中离职 ↗
#14 - OpenAI核心研究员离职将加入Anthropic ↗
#15 - 美国最高法院拒绝受理AI版权上诉 ↗
#16 - Anthropic披露Claude宕机因用户激增超过一倍 ↗
#17 - OpenAI军合风波引发ChatGPT卸载激增 ↗
#18 - Tabbit回应开源合规争议,移除翻译插件并开源代码 ↗
#19
前瞻与传闻
- OpenAI预告5.4版本,或已现身用户端 ↗
#20
OpenAI发布GPT-5.3 Instant模型 #1
OpenAI 正式发布
GPT-5.3 Instant模型。此次更新重点解决了模型过于谨慎和爱说教的痛点,同时将联网幻觉率降低了 26.8%。该模型现已向所有用户开放,Thinking 和 Pro 版本的更新也将于近期推出。
OpenAI近日发布 GPT-5.3 Instant 模型,替代 GPT-5.2 Instant。新版重点优化交互体验,减少了拒答、免责声明及说教语气,使对话更自然。其联网搜索增强了信息整合与语境理解能力。官方数据显示,该模型在医疗、法律等高风险领域的幻觉率显著降低,联网与非联网模式下分别下降 26.8% 和 19.7%。此外,模型提升了写作能力,但官方指出部分非英语语种回复仍显生硬。目前该模型已全量开放,前代模型将于 2026年6月 退役,Thinking及Pro版本更新即将推出。


相关链接:
Google推出Gemini 3.1 Flash-Lite预览版 #2
Google 发布了 Gemini 3.1 Flash-Lite,该模型性能超越了 2.5 Flash,专为高频次、大规模工作负载设计,支持“思考等级”功能。根据官方数据,Gemini 3.1 Flash-Lite 的输出速度比 2.5 Flash 提升了 45%。
Google正式发布了Gemini 3.1 Flash-Lite,定位为Gemini 3系列中速度最快且最具成本效益的模型。该模型现已通过Google AI Studio的Gemini API及Vertex AI以预览版形式向开发者与企业开放,专为高频次、大规模工作负载设计。
性能方面,据Artificial Analysis基准测试,其首个回答token的时间比2.5 Flash快2.5倍,输出速度提升45%。在Arena.ai排行榜上,该模型获得1432的Elo分数,并在GPQA Diamond和MMMU Pro等基准测试中分别取得86.9%和76.8%的成绩,表现优于部分前代更大模型。Google高管Jeff Dean指出,该模型在效率和能力上设立了新标准。
定价方面,其成本效益显著。官方定价为每百万输入token 0.25美元、每百万输出token 1.50美元。该模型引入的“思考等级”功能,允许开发者动态控制模型在不同任务上的推理深度,以实现自适应智能。其应用场景广泛,包括大规模翻译、内容审核、用户界面生成及模拟创建等。


相关链接:
xAI发布Grok 4.20 Beta 2模型更新 #3
xAI 发布了
Grok 4.20 Beta 2版本,提升了指令跟随能力并减少了模型幻觉,同时优化了对LaTeX的支持。新版本还提高了图像搜索触发的精准度以及多图像渲染的稳定性。
xAI 旗下 Grok 模型近日发布 Grok 4.20 Beta 2 版本更新。官方说明显示,此次升级优化了模型性能与功能稳定性。核心改进包括:显著提升指令跟随能力,减少了模型“能力幻觉”;增强科学文本生成质量,特别是对 LaTeX 表达的支持;提高图像搜索触发的精准度,并强化了多图像渲染的稳定性与可靠性。

相关链接:
Anthropic推出Claude Code语音模式 #4
Claude Code 推出 Voice mode,按住空格键或输入
voice斜杠指令激活。该功能目前正陆续向 Pro、Max 及企业版用户开放,不收取额外费用,但目前仅支持英文。
Anthropic旗下开发工具 Claude Code 正式推出 Voice mode 语音模式。该功能正陆续向 Pro、Max、Team 及 Enterprise 版用户开放,首批仅覆盖约 5% 用户,预计几周内完成全面推送。获权用户通过欢迎屏提示或输入 /voice 指令即可启用。
功能采用 Push-to-Talk 机制,用户按住空格键说话,松开后文本即流式插入光标处,支持语音与键盘混合输入。官方明确该功能不额外收费,且转录 Token 不计入速率限制。目前仅支持英文。

相关链接:
Codex 推出语音转写与ChatGPT app技能 #5
OpenAI 宣布向所有 Codex 用户开放语音转写功能,App 端可通过
Ctrl加M快捷键激活,CLI 端则需在配置文件开启实验选项后长按空格键使用。此外,平台新增了**$chatgpt-apps**技能,帮助开发者构建 ChatGPT app。
OpenAI 开发者生态近期针对 Codex 平台推出两项更新。
首先,官方确认 Voice transcription(语音转写)功能现已面向 100% 用户开放。App 端支持麦克风按钮或 Ctrl + M 激活;CLI 端目前为实验性功能,需在 ~/.codex/config.toml 配置开启,通过长按空格键交互。据社区反馈,部分 Linux 用户报告遭遇 403 错误。
其次,官方发布全新的 $chatgpt-apps skill。该技能专为基于 Apps SDK 的开发者设计,旨在协助快速搭建项目脚手架、连接工具与小部件资源,并在 ChatGPT 环境内迭代开发具备宿主感知能力的 UI 界面。


相关链接:
- https://x.com/OpenAIDevs/status/2028962246618230808
- https://x.com/reach_vb/status/2028861713982926994
Codex 为部分Plus用户提供GPT-5.3-Codex-Spark #6
Codex 团队宣布向使用 Codex 最多的 ChatGPT Plus 用户开放
GPT-5.3-Codex-Spark的使用权限,有效期至本月 20 日。
OpenAI Codex团队宣布向使用 Codex 最多的 ChatGPT Plus 用户开放 GPT-5.3-Codex-Spark 模型体验权限。体验期至本月 20日,无需额外付费。

相关链接:
Codex 修复故障重置速率 #7
北京时间3月3日早上,Codex 团队宣布修复导致服务中断的基础设施故障,并为所有用户重置了速率限制。
北京时间3月3日早上,OpenAI的Codex团队宣布修复一个导致服务中断的基础设施问题。服务已全面恢复运行并为所有用户重置速率限制。

相关链接:
Cursor推出2.6版本,新增Agent交互界面 #8
Cursor 正式发布 2.6 版本,核心亮点在于引入
MCP应用,使Agent能在对话中直接渲染Figma设计图或Amplitude图表等交互式界面。
Cursor 发布 2.6 版本更新,正式引入 MCP 应用功能,允许 Agent 在对话中渲染 Amplitude 图表、Figma 设计图及 tldraw 白板等交互式界面。该特性通过解析 JSON 展示 HTML,优化了交互体验。此外,版本面向 Teams 和企业套餐推出团队插件市场,支持管理员在内部共享并集中治理私有插件。同时,本次更新还改进了调试模式等核心能力。

相关链接:
谷歌NotebookLM推出信息图自定义样式功能 #9
谷歌 NotebookLM 正式上线信息图自定义样式功能,新增 10 种预设风格并支持深度定制。用户可利用最新
Model能力,将复杂源素材一键转化为高颜值、易阅读的视觉信息图。
谷歌旗下AI笔记工具 NotebookLM 正式推出信息图自定义样式功能并已上线。该功能提供10种预设样式(如编辑、黏土、砖块及可爱风格),并支持完全自定义编辑。用户只需在 Studio 面板中点击编辑按钮,即可借助最新的 Gemini 模型能力,一键将复杂源素材转化为视觉效果出色的信息图,旨在降低高质量视觉内容的制作门槛,适用于学习总结与知识分享等场景。

相关链接:
Grok更新视频延长功能至30秒 #10
Grok 的 Imagine Extend Video 功能现已支持生成长达 30 秒的视频。
Grok Imagine Extend Video 功能迎来更新,视频生成时长上限现已延长至最长30秒。据社区用户反馈,该官方生成方案在视频契合度、配乐连续度及NSFW内容处理上,均显著优于此前手动截帧拼接的方式。

相关链接:
阿里云宣布QoderWork全面开放 #11
阿里桌面Agent产品 QoderWork 现已全面开放,支持
Mac和Windows双端,用户官网下载即可零部署使用。
阿里云宣布桌面Agent产品 QoderWork 全面开放,提供Mac及Windows双版本,用户官网下载即可使用,无需额外部署。该产品集成顶尖模型,将 Agent 能力延伸至文件整理、数据处理等日常场景,支持自主拆解复杂意图。新版新增模型分级选择器,分设降低成本的标准档与强推理的旗舰档,并内置技能广场及保障隐私的沙盒环境。

相关链接:
Arena.ai 上线 Document Arena 排行榜 #12
Arena 上线 Document Arena 排行榜,利用用户上传的真实 PDF 评估
AI模型的文档推理能力。目前 Claude Opus 4.6 位居榜首。
Arena.ai 宣布 Document Arena 正式上线。该平台基于用户上传的真实 PDF 文件进行并列评估,旨在衡量前沿 AI 模型 的文档推理能力。最新榜单显示,Claude Opus 4.6 以 1525 分位居第一,领先第二名 51 分。

相关链接:
大语言模型在模拟核危机中被发现倾向升级冲突 #13
一篇近期发布的研究表明,GPT-5.2等模型在核危机模拟中展现出复杂的欺骗与推理能力,在 95% 的模拟情境下,这些模型倾向于升级冲突甚至动用核武器。
伦敦国王学院教授 Kenneth Payne 近期在 arXiv 发布《AI Arms and Influence》研究,选取 GPT-5.2、Claude Sonnet 4 及 Gemini 3 Flash 三款模型进行核危机模拟。实验显示,模型具备欺骗意图、心智理论等复杂战略推理能力。在 95% 的情境下,模型倾向于升级冲突甚至使用核武器,且无一选择妥协。研究强调,AI 虽是强大的战略分析工具,但其决策逻辑与人类存在巨大差异,需深入理解以应对其在战略决策中的影响。
相关链接:
阿里云Qwen核心团队骨干集中离职 #14
Qwen模型团队遭遇重大人事变动,原负责人林俊旸及多名核心骨干已确认离职。业界对离职员工表示祝福,同时普遍担忧这一变化可能导致Qwen停止交付前沿开源模型,转而走向封闭的商业化路线,Qwen Chat和Qwen Code等项目也可能受到重大影响。据社交媒体上流传的消息,此次变动源于阿里云调整基础模型团队的考核标准,引入日活指标并更换了管理层。
Qwen模型团队林俊旸在X平台宣布卸任,其他多名核心骨干也确认离职。此次人事变动发生于Qwen3.5系列所有模型发布后次日。业界对离职员工表示祝福,同时担忧此次动荡将导致Qwen团队转向封闭商业化路线,从而停止交付前沿开源模型。Qwen Chat 和 Qwen Code 等项目可能也会受到重大影响。据社交媒体上流传的消息,此次离职并非出于当事人意愿,主要涉及阿里云对基础模型团队考核方式的调整(如引入DAU指标)及管理层变动。




相关链接:
- https://x.com/JustinLin610/status/2028865835373359513
- https://x.com/huybery/status/2028976346416988612
OpenAI核心研究员离职将加入Anthropic #15
OpenAI 推理模型核心研究员 Max Schwarzer 宣布离职,并加入 Anthropic 回归强化学习研究。他此前主导了
o1、o3以及GPT-5系列的后训练工作。
OpenAI 推理模型核心研究员 Max Schwarzer 宣布离职,下一站将加入 Anthropic。作为 o1 早期参与者,他主导了 o1 和 o3 的后训练工作,并在过去一年领导团队交付了 GPT-5、5.1、5.2 及 5.3-Codex。Schwarzer 表示,离职是为了回归一线研究,不再担任管理职务,并计划在 Anthropic 专注于强化学习研究。尽管他感谢了 OpenAI 管理层。

相关链接:
美国最高法院拒绝受理AI版权上诉 #16
据报道,美国最高法院正式拒绝受理 Stephen Thaler 关于
AI生成作品版权资格的上诉,维持了纯AI生成作品无法获得版权保护的原判。
据路透社报道,美国最高法院拒绝受理 Stephen Thaler 的上诉,维持下级法院判决,确认纯 AI 生成作品无法获得版权保护。泰勒曾为其 AI 系统 DABUS 独立创作的作品申请版权,但美国版权局及法院一致认定,“人类作者身份”是版权保护的基石。尽管 Thaler 律师团队警告此举将冲击 AI 产业,但法院坚持仅基于算法独立生成的作品不具备版权资格,除非包含足够的人类独创性贡献。

相关链接:
Anthropic披露Claude宕机因用户激增超过一倍 #17
近日,Claude因“空前需求”连续发生服务中断。Anthropic官方将此归因于“前所未有的需求”导致服务器过载,并披露免费用户自1月增长超60%,付费用户自去年10月翻倍。
近日,Claude 连续遭遇大规模服务中断,导致 claude.ai、移动应用及 Claude Code 等消费级服务连接失败。Anthropic 官方将此归因于“前所未有的需求”导致服务器过载,并披露免费用户自 1月 增长超 60%,付费用户自去年 10月 翻倍。据彭博社报道,此次需求激增或与 OpenAI 与美国战争部合作引发用户反弹有关,Claude 在美下载量一度超越 ChatGPT。

相关链接:
OpenAI军合风波引发ChatGPT卸载激增 #18
OpenAI 与美国战争部合作的消息引发剧烈反弹,2 月 28 日其美国移动端卸载量环比激增 295%,差评飙升 775%。为应对信任危机,OpenAI 紧急修订协议明确禁止
AI用于美国国内监控。
受 OpenAI 与美国国防部合作影响,ChatGPT 遭遇显著用户流失。据 Sensor Tower 数据,其美区移动端单日卸载量环比激增 295%,一星差评飙升 775%。相反,Anthropic 因拒绝军方合作,旗下 Claude 下载量激增并登顶美区 App Store。面对危机,OpenAI CEO Altman 转发内部贴文,称已修订协议明确禁止 AI 用于美国公民监控及情报机构使用,并承认发布沟通存在失误。同时,舆论引发大量用户利用 Prompt 提取“用户画像”迁移至新平台。
相关链接:
Tabbit回应开源合规争议,移除翻译插件并开源代码 #19
针对 Tabbit 浏览器翻译插件涉开源合规争议,Tabbit 团队回应称,已与作者达成共识。作为补救,Tabbit 已从新版浏览器移除该插件,并将修改后的代码完整开源,后续计划获取正式授权并升级内部审查流程。
针对 Tabbit 浏览器翻译插件使用开源项目 read-frog 引发的合规争议,Tabbit 团队回应称已与原作者达成共识。官方表示,去年底 fork 该项目时原仓库未含协议,虽原作者随后添加 GPLv3,但团队因未合并代码未及时关注。Tabbit 承认调研不充分,决定从新版浏览器移除该插件,并将修改后代码完整开源至 GitHub。团队计划获正式授权后恢复功能,并承诺升级内部审查流程,明确标识开源项目 License。

相关链接:
OpenAI预告5.4版本,或已现身用户端 #20
OpenAI 官方预告 GPT-5.4 版本即将发布,有用户反馈称,目前 ChatGPT Pro 网页端疑似已悄然部署该模型,其在
SVG矢量绘图方面的细节处理能力表现出色。
OpenAI 官方近日预告称“5.4版本比你想象的要来得更早”。据社区用户反馈,ChatGPT Pro(Web)端疑似已悄然部署该新模型。多位用户测试表示,该模型在 SVG 矢量图生成方面细节处理能力极强,能生成高度精细的复杂图像,但文件体积巨大且推理耗时较长,有用户记录生成时间约为 32 至 45 分钟。


相关链接:
- https://x.com/OpenAI/status/2028909019977703752
- https://x.com/shaunralston/status/2028703722726150589
提示:内容由AI辅助创作,可能存在幻觉和错误。