AI 早报 2026-03-03

视频版：哔哩哔哩｜ YouTube

概览

要闻

千问团队开源Qwen3.5小尺寸模型系列 ↗ #1
智谱 GLM Coding Plan 套餐开启退款通道 #2

模型发布

阶跃星辰开源Step 3.5 Flash模型及训练框架 ↗ #3
IQuestLab开源IQuest-Coder-V1系列代码模型权重 ↗ #4
小红书开源FireRed-OCR模型 ↗ #5
通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 ↗ #6
Jan团队发布 Jan-Code-4B 模型 ↗ #7

开发生态

OpenClaw发布2026.3.1版本 ↗ #8
agent-browse上线Electron技能 ↗ #9
Anthropic推出免费AI课程 ↗ #10
Kimi开放平台推出限时充值返券活动 ↗ #11

产品应用

美团推出Tabbit浏览器并陷开源抄袭争议 ↗ #12
Anthropic向免费用户开放Claude记忆功能 ↗ #13
MiniMax推出移动端MaxClaw ↗ #14
千问发布AI眼镜AI硬件，售价低至1997元 ↗ #15

技术与洞察

字节跳动联合清华发布CUDA Agent强化学习系统 ↗ #16

行业动态

MiniMax发布2025财年全年业绩报告 ↗ #17
阿里巴巴统一AI品牌为千问 ↗ #18
智谱Z.ai启动面向AI创业者的扶持计划 ↗ #19

前瞻与传闻

马斯克确认将于今日发布Grok 4.20 Beta 2 ↗ #20

千问团队开源Qwen3.5小尺寸模型系列 `#1`

Qwen 团队正式发布了 Qwen 3.5 小模型系列，涵盖 0.8B、2B、4B 和 9B 四款模型，该系列模型在多项评测中创下同等尺寸性能新高。其中，0.8B 和 2B 模型体积小巧、速度快，适合边缘设备计算。4B 模型被定位为轻量级 Agent 的强力多模态底座。9B 模型则在紧凑体积下大幅缩小了与更大参数模型的能力差距。

千问团队正式开源 Qwen3.5 小尺寸模型系列，涵盖 0.8B、2B、4B 和 9B 四款模型，家族矩阵扩至8款。新模型基于原生多模态基座，融合 Gated Delta Networks 与稀疏 MoE 架构，原生支持 262K 上下文并可扩展至 1M+。系列采用 Apache 2.0 协议，同步开源基座与对话模型。其中 0.8B/2B 主打端侧部署，默认非思考模式；4B 定位轻量 Agent；9B 宣称具备越级性能。目前模型已登陆 HF、魔搭及 Ollama，官方数据显示其在多模态及 Agent 基准测试中表现优异。

相关链接：

智谱 GLM Coding Plan 套餐开启退款通道 `#2`

智谱 GLM Coding Plan 套餐现已开启退款通道，2025年12月19日前购买的用户需手动提交工单办理。

据社区用户反馈，智谱GLM Coding Plan退款通道开启，2025年12月19日前购买需手动提交工单。

阶跃星辰开源Step 3.5 Flash模型及训练框架 `#3`

阶跃星辰正式开源 Step 3.5 Flash 基础及中间训练版模型，同步公开了仅需 PyTorch 依赖的 SteptronOSS 训练框架，两者均遵循 Apache 2.0 协议。

阶跃星辰 StepFun 宣布开源 Step 3.5 Flash 模型基础版与中间训练版，同步公开训练代码库 SteptronOSS。该模型采用稀疏 MoE 架构，总参数 196B，激活 11B，支持 256K 上下文。引入多Token预测技术，生成吞吐量峰值达 350 tok/s。官方数据显示，其在 SWE-bench Verified 和 Terminal-Bench 2.0 上分别达 74.4% 和 51.0%。SteptronOSS 框架支持 SFT、RLVR 及评估，仅需 PyTorch 运行。模型权重已上线 Hugging Face，采用 Apache 2.0 协议，SFT 数据集后续发布。

相关链接：

IQuestLab开源IQuest-Coder-V1系列代码模型权重 `#4`

IQuestLab 已正式在 Hugging Face 上开源 IQuest-Coder-V1 全系列模型权重，涵盖 7B 至 40B 的 Thinking 等多个版本。

IQuestLab 正式开源并上传 IQuest-Coder-V1 系列模型权重至 Hugging Face，涵盖 7B、14B（Base、Instruct、Thinking 变体）及 40B Thinking、40B-Loop-Thinking 实验变体，面向自主软件工程与代码智能领域。

该系列模型采用浅层架构设计，据官方说明，其在 7B 和 14B 规模下可实现 3-5 倍的推理加速。训练方面，模型应用 Code-Flow 训练范式，从代码仓库的演化模式、Commit 迁移中学习。在后训练阶段，通过分叉式策略衍生出专精模型：Thinking 版本基于推理驱动的强化学习解决复杂编程问题；Instruct 版本侧重通用代码协作。作为实验性原型，40B-Loop-Thinking 采用循环 Transformer 设计，旨在探索嵌套式推理机制。

相关链接：

小红书开源FireRed-OCR模型 `#5`

小红书 REDtech 团队开源了 FireRed-OCR 模型，该模型基于 Qwen3-VL-2B 架构，在文本识别、公式解析及表格重构等关键指标上全面领先。

小红书 REDtech 团队近日宣布开源基于 Qwen3-VL-2B 架构的智能文档处理模型 FireRed-OCR，旨在解决视觉语言模型在复杂文档处理中的“结构性幻觉”问题。该模型首创“三阶段渐进优化”策略与“几何+语义”数据工厂，显著提升了结构化解析能力。

官方数据显示，在 OmniDocBench v1.5 评测中，FireRed-OCR 以 92.94% 的综合准确率刷新纪录，成为首个突破 92% 阈值的端到端模型。其在文本识别、公式解析、表格重构及阅读顺序等细分指标上均表现优异。目前，该模型已在 GitHub、Hugging Face 及 ModelScope 等平台全面开源。

相关链接：

通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 `#6`

阿里通义实验室发布了 Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型。前者专注多语种复刻与精细化控制，后者定位全场景声音设计，支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前，两款模型均已开放 API 调用。

阿里通义实验室发布 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 两款语音模型，支持 FreeStyle 指令生成。Fun-CosyVoice3.5 专注多语种复刻与精细化控制，引入 DiffRO 与 GRPO 技术，使生僻字读错率从 15.2% 降至 5.3%，首包延迟降低 35%，新增泰语等四个语种。Fun-AudioGen-VD 定位全场景声音设计，支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前两模型均已提供 API 调用。

相关链接：

https://mp.weixin.qq.com/s/sTNC7bVphs9zofly3lBoUQ

Jan团队发布 Jan-Code-4B 模型 `#7`

Jan团队发布了基于 Qwen3 架构的40亿参数代码模型 Jan-Code-4B，该模型主打本地低延迟运行。

Jan团队近日发布40亿参数代码调优模型 Jan-Code-4B，底层架构源自 Qwen3-4B-Instruct-2507。该模型专为本地低延迟迭代设计，旨在作为轻量级编程助手或Agent工作流中的快速Worker，替代Claude Code设置中的 Haiku 模型。

相关链接：

https://huggingface.co/janhq/Jan-code-4b

OpenClaw发布2026.3.1版本 `#8`

OpenClaw 发布 2026.3.1 版本。此次更新重点引入了 OpenAI WebSocket 与 Claude 4.6 自适应思考，显著改善了容器化部署支持，并推出了 Agent 驱动的可视化差异插件。同时，其 GitHub Star 数已超过 React。

OpenClaw 正式发布 2026.3.1 版本，新版本引入 OpenAI WebSocket streaming，支持 Claude 4.6 adaptive thinking，并显著优化了 Docker 及 Native K8s 体验。生态集成上，新增 Discord threads 支持，修复 Feishu 相关问题，并推出 Agent 驱动的 visual diffs plugin。此外，其 GitHub Star 数已超越 React。

相关链接：

agent-browse上线Electron技能 `#9`

agent-browser 上线了 Electron 新技能，允许 Agent 绕过视觉识别，通过直接读取 HTML 来控制 Discord、Figma 及 VS Code 等桌面应用。开发者现可通过一条 npx 命令将该技能集成至任意编程 Agent 中，即刻实现桌面应用的自动化控制与调试。

agent-browser 发布了 Electron 新技能，允许 Agent 直接控制 Discord、Figma、Notion、Spotify 及 VS Code 等桌面应用。该功能不依赖视觉识别，而是将 Electron 应用视为浏览器，通过读取渲染的 HTML 进行交互，适用于自动化控制及应用调试。开发者可通过 npx skills add vercel-labs/agent-browser --skill electron 命令集成该技能。此外，agent-browser 也支持通过相应命令控制 Slack 客户端。

相关链接：

Anthropic推出免费AI课程 `#10`

Anthropic 上线了一套完全免费且无需注册的 AI 课程，内容涵盖 Claude Code 实战、Agent Skill 构建等前沿技术。

Anthropic近日上线一套免费AI课程，无需账号即可通过官网访问并获取证书。课程核心涵盖Claude Code实战、Claude API构建及模型上下文协议MCP全栈开发，包含Agent Skill构建与Amazon Bedrock、Google Vertex AI云平台整合内容。此外，该系列还提供基础AI流利度培训，并专为教育工作者、学生及非营利组织提供定制化课程，旨在帮助不同群体高效、安全地将AI能力融入工作与教学。

相关链接：

http://anthropic.skilljar.com

Kimi开放平台推出限时充值返券活动 `#11`

Kimi 开放平台即日起至 3 月 8 日 推出限时充值活动，最高可获赠 40% 代金券。

Kimi开放平台宣布即日起至3月8日推出限时充值活动，用户充值达到不同档位数额可获赠对应20%至40%代金券，券于次日发放且有效期90天。活动重点推广Kimi K2.5多模态模型，得益于Mooncake架构，该模型缓存命中率约90%，使API实际输入价格仅为原定价的25%。

相关链接：

https://mp.weixin.qq.com/s/aVF9bf8Wc44lwZY_zF0w5g

美团推出Tabbit浏览器并陷开源抄袭争议 `#12`

美团旗下光年之外团队发布AI原生浏览器 Tabbit 并开启公测，该产品基于Chrome内核，用户可通过“全能输入框”调用Agent自主执行网页任务，国际版内置GPT-5.2、Claude-Sonnet-4.6等多款主流大模型。但产品发布即遭遇争议，被开发者指控违反GPL协议抄袭开源项目陪读蛙。

近日，美团旗下光年之外团队与北京酷讯联合发布AI原生浏览器 Tabbit 并开启公测。该产品基于Chrome内核，集成了智能代理模式与“全能输入框”，支持自主执行网页任务及无代码扩展，国际版内置 GPT-5.2、Claude-Sonnet-4.6 等多款主流大模型。与此同时，开源开发者 mengxi-ream 公开指控 Tabbit 涉嫌抄袭其开源项目“陪读蛙”，称其违反GPL协议使用代码但未开源，目前该事件已在社区引发关于开源合规性的热议。

相关链接：

Anthropic向免费用户开放Claude记忆功能 `#13`

Anthropic 正式向免费用户开放了 Claude 的记忆功能，同时支持用户导出记忆，或从其他 AI 聊天机器人导入记忆。

Anthropic 官方宣布，Claude 的 Memory 功能现已正式向免费计划用户开放。免费用户现可利用该功能记住用户偏好及历史交互，从而获得更个性化的体验。此次更新重点优化了数据迁移与便携性。官方表示，已简化将保存的 Memory 导入 Claude 的流程。此外，用户拥有完全的数据控制权，可随时导出已保存的内容，确保数据的跨平台可用性。

相关链接：

https://x.com/claudeai/status/2028559427167834314

MiniMax推出移动端MaxClaw `#14`

MiniMax 移动端 App 正式上线 MaxClaw 功能，实现了与 Web 端的消息同步，用户可在手机端直接与 Agent 交互。

MiniMax 官方宣布移动端 App 上线 MaxClaw 功能，支持 Web 端消息同步，用户可直接与 Agent 交互，无需依赖即时通讯软件。

相关链接：

https://x.com/MiniMaxAgent/status/2028445211593208230

千问发布AI眼镜AI硬件，售价低至1997元 `#15`

千问首款AI眼镜开启预约，将于3月8日现货发售，G1系列叠加优惠后到手价低至1997元。该产品整机仅重40克，搭载最新千问大模型，支持3K视频录制、实时翻译及会议记录。

千问正式发布首款 AI 硬件“千问 AI 眼镜”，首发 S1 与 G1 系列。产品现已开启全渠道“0 元预约”，定于 3 月 8 日在中国现货发售，计划年内登陆全球市场。其中 G1 系列标价 2899 元，叠加优惠后低至 1997 元。

该眼镜搭载最新千问大模型，整机重约 40g，支持换电及“手机级”影像技术，具备 3K 视频录制与 AI 4K 输出能力。功能上支持多模态交互、翻译及会议记录。此外，产品将接入千问 App，首批“办事”功能预计 3 月底开放，并计划适配 Spotify、PayPal 等国际生态。

相关链接：

字节跳动联合清华发布CUDA Agent强化学习系统 `#16`

ByteDance Seed 联合清华大学智能产业研究院推出了名为 CUDA Agent 的大规模强化学习系统，旨在通过真实硬件数据反馈自动生成高性能的 CUDA Kernel。

ByteDance Seed 联合清华大学 AIR 及 SIA-Lab 发布“CUDA Agent”项目及论文。该系统系大规模 Agentic RL 架构，通过利用真实 GPU Profiling 数据作为奖励信号，生成高性能 CUDA Kernel。项目构建了三阶段数据流水线，产出了含 6000 样本的 CUDA-Agent-Ops-6K 数据集，并采用 ReAct 工作流及分阶段训练策略。官方 KernelBench 数据显示，CUDA Agent 几何平均加速比为 2.11 倍；在 Level-1 和 Level-2 任务中相比 torch.compile 达 100% 加速率，Level-3 任务中达 90%。其表现击败 Claude Opus 4.5 等闭源模型约 40 个百分点。目前代码库与数据集已分别在 GitHub 和 Hugging Face 上线。

相关链接：

MiniMax发布2025财年全年业绩报告 `#17`

MiniMax发布2025财年业绩，总营收7903.8万美元，同比增长158.9%，其中海外市场贡献约73%。期内毛利率提升至25.4%，经调整净亏损为2.509亿美元，亏损率收窄，现金储备10.5亿美元。

MiniMax（00100.HK）发布上市后首份年报，2025年总收入7903.8万美元，同比增长158.9%，超70%收入源自国际市场。公司毛利增至2010万美元，毛利率提升至25.4%，经调整净亏损2.509亿美元，亏损率同比显著收窄。官方称已完成全模态布局，累计服务用户超2.36亿，最新发布的M2.5模型编程效率提升37%且成本大幅降低。CEO闫俊杰透露截至2026年2月公司ARR已超1.5亿美元，Notion已集成其模型。未来MiniMax将向AI平台型公司迈进。

相关链接：

https://minimaxi.com/news/minimax%E5%8F%91%E5%B8%83-2025-%E5%B9%B4%E5%85%A8%E5%B9%B4%E4%B8%9A%E7%BB%A9

阿里巴巴统一AI品牌为千问 `#18`

阿里巴巴宣布将大模型B端品牌和C端应用品牌统一为千问。统一名称之后，阿里巴巴大模型品牌中文为“千问大模型”，英文为“Qwen”。通义干问的名称将不再使用。

阿里巴巴近日宣布将旗下AI业务品牌矩阵全面统一更名为千问（Qwen），此举标志着其AI战略进入新阶段。据官方公告，原“通义千问”系列更名为千问大模型，C端旗舰应用更名为千问 APP，而“通义实验室”将继续作为AI研发机构专注技术突破。

品牌重塑紧随其后强劲的技术表现。阿里巴巴于除夕开源了Qwen 3.5系列模型，官方显示该系列多款模型包揽了Hugging Face全球开源大模型榜单前四名，已成为全球开发者社区活跃度最高的开源模型之一。

市场应用层面，千问APP表现突出。官方数据显示，其在春节期间处理了近2亿次“一句话下单”指令。根据第三方机构QuestMobile统计，该应用日活跃用户达到7352万，增幅高达940%，位居国内AI类应用前列，显示出强大的用户粘性与市场吸引力。

此外，有行业分析认为，阿里巴巴此次统一品牌旨在通过品牌降维与认知聚合，强化其在开源生态与C端市场的领导地位。随着Qwen 3.5体系的完善，这种从技术领先向品牌生态化的转型，或将重塑国内大模型行业的竞争格局。

相关链接：

https://mp.weixin.qq.com/s/ZNt7WYcKoydV04Weu1p0qQ

智谱Z.ai启动面向AI创业者的扶持计划 `#19`

智谱 Z.ai 宣布 Startup Program 正式开放申请，入选团队将获得 Free API credits、Priority rate limits 以及 Early API Access 等核心权益。

智谱Z.ai 宣布 Startup Program 现已开放申请，旨在支持 AI-native 初创企业、Agent 构建者、集成 LLM infra 的 SaaS 创始人及构建现实世界规模应用的全球团队。入选团队将获得 Free API credits、Priority rate limits、Exclusive Community 访问权以及 Early API Access 等权益。官方建议正在构建重要产品的团队立即通过 startup.z.ai 提交申请，如有疑问可联系 @ZaiforStartups。

相关链接：

http://startup.z.ai

马斯克确认将于今日发布Grok 4.20 Beta 2 `#20`

xAI 首席执行官 Elon Musk 确认 Grok 4.20 Beta 2 将于今日发布，并将同步公开详细的版本说明。

xAI 首席执行官 Elon Musk 确认，Grok 4.20 Beta 2 将于今日发布，并同步公开详细版本说明。此次更新回应了社区对模型迭代的期待，用户重点关注代码能力提升及不同规格模型的发布计划。另据非官方反馈，巴西地区 Grok 服务疑似中断；部分 SuperGrok Heavy 订阅用户在 Grok Build 抢先体验网站提交邮箱时遭遇 HTTP 405 错误，导致无法获取优先访问权限。

相关链接：

https://x.com/elonmusk/status/2028491891562660329

提示：内容由AI辅助创作，可能存在幻觉和错误。

Contents

AI 早报 2026-03-03

概览

要闻

模型发布

开发生态

产品应用

技术与洞察

行业动态

前瞻与传闻

千问团队开源Qwen3.5小尺寸模型系列 #1

智谱 GLM Coding Plan 套餐开启退款通道 #2

阶跃星辰开源Step 3.5 Flash模型及训练框架 #3

IQuestLab开源IQuest-Coder-V1系列代码模型权重 #4

小红书开源FireRed-OCR模型 #5

通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 #6

Jan团队发布 Jan-Code-4B 模型 #7

OpenClaw发布2026.3.1版本 #8

agent-browse上线Electron技能 #9

Anthropic推出免费AI课程 #10

Kimi开放平台推出限时充值返券活动 #11

美团推出Tabbit浏览器并陷开源抄袭争议 #12

Anthropic向免费用户开放Claude记忆功能 #13

MiniMax推出移动端MaxClaw #14

千问发布AI眼镜AI硬件，售价低至1997元 #15

字节跳动联合清华发布CUDA Agent强化学习系统 #16

MiniMax发布2025财年全年业绩报告 #17

阿里巴巴统一AI品牌为千问 #18

智谱Z.ai启动面向AI创业者的扶持计划 #19

马斯克确认将于今日发布Grok 4.20 Beta 2 #20

千问团队开源Qwen3.5小尺寸模型系列 `#1`

智谱 GLM Coding Plan 套餐开启退款通道 `#2`

阶跃星辰开源Step 3.5 Flash模型及训练框架 `#3`

IQuestLab开源IQuest-Coder-V1系列代码模型权重 `#4`

小红书开源FireRed-OCR模型 `#5`

通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 `#6`

Jan团队发布 Jan-Code-4B 模型 `#7`

OpenClaw发布2026.3.1版本 `#8`

agent-browse上线Electron技能 `#9`

Anthropic推出免费AI课程 `#10`

Kimi开放平台推出限时充值返券活动 `#11`

美团推出Tabbit浏览器并陷开源抄袭争议 `#12`

Anthropic向免费用户开放Claude记忆功能 `#13`

MiniMax推出移动端MaxClaw `#14`

千问发布AI眼镜AI硬件，售价低至1997元 `#15`

字节跳动联合清华发布CUDA Agent强化学习系统 `#16`

MiniMax发布2025财年全年业绩报告 `#17`

阿里巴巴统一AI品牌为千问 `#18`

智谱Z.ai启动面向AI创业者的扶持计划 `#19`

马斯克确认将于今日发布Grok 4.20 Beta 2 `#20`