2026-03-03

AI 早报 2026-03-03
概览
要闻
- 千问团队开源Qwen3.5小尺寸模型系列 ↗
#1 - 智谱 GLM Coding Plan 套餐开启退款通道
#2
模型发布
- 阶跃星辰开源Step 3.5 Flash模型及训练框架 ↗
#3 - IQuestLab开源IQuest-Coder-V1系列代码模型权重 ↗
#4 - 小红书开源FireRed-OCR模型 ↗
#5 - 通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 ↗
#6 - Jan团队发布 Jan-Code-4B 模型 ↗
#7
开发生态
- OpenClaw发布2026.3.1版本 ↗
#8 - agent-browse上线Electron技能 ↗
#9 - Anthropic推出免费AI课程 ↗
#10 - Kimi开放平台推出限时充值返券活动 ↗
#11
产品应用
- 美团推出Tabbit浏览器并陷开源抄袭争议 ↗
#12 - Anthropic向免费用户开放Claude记忆功能 ↗
#13 - MiniMax推出移动端MaxClaw ↗
#14 - 千问发布AI眼镜AI硬件,售价低至1997元 ↗
#15
技术与洞察
- 字节跳动联合清华发布CUDA Agent强化学习系统 ↗
#16
行业动态
前瞻与传闻
- 马斯克确认将于今日发布Grok 4.20 Beta 2 ↗
#20
千问团队开源Qwen3.5小尺寸模型系列 #1
Qwen 团队正式发布了 Qwen 3.5 小模型系列,涵盖
0.8B、2B、4B和9B四款模型,该系列模型在多项评测中创下同等尺寸性能新高。其中,0.8B和2B模型体积小巧、速度快,适合边缘设备计算。4B模型被定位为轻量级 Agent 的强力多模态底座。9B模型则在紧凑体积下大幅缩小了与更大参数模型的能力差距。
千问团队正式开源 Qwen3.5 小尺寸模型系列,涵盖 0.8B、2B、4B 和 9B 四款模型,家族矩阵扩至8款。新模型基于原生多模态基座,融合 Gated Delta Networks 与稀疏 MoE 架构,原生支持 262K 上下文并可扩展至 1M+。系列采用 Apache 2.0 协议,同步开源基座与对话模型。其中 0.8B/2B 主打端侧部署,默认非思考模式;4B 定位轻量 Agent;9B 宣称具备越级性能。目前模型已登陆 HF、魔搭及 Ollama,官方数据显示其在多模态及 Agent 基准测试中表现优异。


相关链接:
智谱 GLM Coding Plan 套餐开启退款通道 #2
智谱 GLM Coding Plan 套餐现已开启退款通道,2025年12月19日前购买的用户需手动提交工单办理。
据社区用户反馈,智谱GLM Coding Plan退款通道开启,2025年12月19日前购买需手动提交工单。


阶跃星辰开源Step 3.5 Flash模型及训练框架 #3
阶跃星辰正式开源 Step 3.5 Flash 基础及中间训练版模型,同步公开了仅需
PyTorch依赖的SteptronOSS训练框架,两者均遵循 Apache 2.0 协议。
阶跃星辰 StepFun 宣布开源 Step 3.5 Flash 模型基础版与中间训练版,同步公开训练代码库 SteptronOSS。该模型采用稀疏 MoE 架构,总参数 196B,激活 11B,支持 256K 上下文。引入多Token预测技术,生成吞吐量峰值达 350 tok/s。官方数据显示,其在 SWE-bench Verified 和 Terminal-Bench 2.0 上分别达 74.4% 和 51.0%。SteptronOSS 框架支持 SFT、RLVR 及评估,仅需 PyTorch 运行。模型权重已上线 Hugging Face,采用 Apache 2.0 协议,SFT 数据集后续发布。

相关链接:
- https://github.com/stepfun-ai/SteptronOss
- https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base
- https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base-Midtrain
IQuestLab开源IQuest-Coder-V1系列代码模型权重 #4
IQuestLab 已正式在 Hugging Face 上开源 IQuest-Coder-V1 全系列模型权重,涵盖
7B至40B的Thinking等多个版本。
IQuestLab 正式开源并上传 IQuest-Coder-V1 系列模型权重至 Hugging Face,涵盖 7B、14B(Base、Instruct、Thinking 变体)及 40B Thinking、40B-Loop-Thinking 实验变体,面向自主软件工程与代码智能领域。
该系列模型采用浅层架构设计,据官方说明,其在 7B 和 14B 规模下可实现 3-5 倍的推理加速。训练方面,模型应用 Code-Flow 训练范式,从代码仓库的演化模式、Commit 迁移中学习。在后训练阶段,通过分叉式策略衍生出专精模型:Thinking 版本基于推理驱动的强化学习解决复杂编程问题;Instruct 版本侧重通用代码协作。作为实验性原型,40B-Loop-Thinking 采用循环 Transformer 设计,旨在探索嵌套式推理机制。

相关链接:
- https://iquestlab.github.io/release-1.0-2603/index.html
- https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Thinking
- https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Thinking
- https://huggingface.co/IQuestLab/IQuest-Coder-V1-14B-Instruct
- https://huggingface.co/IQuestLab/IQuest-Coder-V1-7B-Instruct
小红书开源FireRed-OCR模型 #5
小红书 REDtech 团队开源了
FireRed-OCR模型,该模型基于Qwen3-VL-2B架构,在文本识别、公式解析及表格重构等关键指标上全面领先。
小红书 REDtech 团队近日宣布开源基于 Qwen3-VL-2B 架构的智能文档处理模型 FireRed-OCR,旨在解决视觉语言模型在复杂文档处理中的“结构性幻觉”问题。该模型首创“三阶段渐进优化”策略与“几何+语义”数据工厂,显著提升了结构化解析能力。
官方数据显示,在 OmniDocBench v1.5 评测中,FireRed-OCR 以 92.94% 的综合准确率刷新纪录,成为首个突破 92% 阈值的端到端模型。其在文本识别、公式解析、表格重构及阅读顺序等细分指标上均表现优异。目前,该模型已在 GitHub、Hugging Face 及 ModelScope 等平台全面开源。

相关链接:
通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 #6
阿里通义实验室发布了 Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型。前者专注多语种复刻与精细化控制,后者定位全场景声音设计,支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前,两款模型均已开放
API调用。
阿里通义实验室发布 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 两款语音模型,支持 FreeStyle 指令生成。Fun-CosyVoice3.5 专注多语种复刻与精细化控制,引入 DiffRO 与 GRPO 技术,使生僻字读错率从 15.2% 降至 5.3%,首包延迟降低 35%,新增泰语等四个语种。Fun-AudioGen-VD 定位全场景声音设计,支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前两模型均已提供 API 调用。


相关链接:
Jan团队发布 Jan-Code-4B 模型 #7
Jan团队发布了基于
Qwen3架构的40亿参数代码模型 Jan-Code-4B,该模型主打本地低延迟运行。
Jan团队近日发布40亿参数代码调优模型 Jan-Code-4B,底层架构源自 Qwen3-4B-Instruct-2507。该模型专为本地低延迟迭代设计,旨在作为轻量级编程助手或Agent工作流中的快速Worker,替代Claude Code设置中的 Haiku 模型。

相关链接:
OpenClaw发布2026.3.1版本 #8
OpenClaw 发布 2026.3.1 版本。此次更新重点引入了
OpenAI WebSocket与Claude 4.6自适应思考,显著改善了容器化部署支持,并推出了 Agent 驱动的可视化差异插件。同时,其 GitHub Star 数已超过 React。
OpenClaw 正式发布 2026.3.1 版本,新版本引入 OpenAI WebSocket streaming,支持 Claude 4.6 adaptive thinking,并显著优化了 Docker 及 Native K8s 体验。生态集成上,新增 Discord threads 支持,修复 Feishu 相关问题,并推出 Agent 驱动的 visual diffs plugin。此外,其 GitHub Star 数已超越 React。


相关链接:
- https://github.com/openclaw/openclaw/releases/tag/v2026.3.1
- https://x.com/openclaw/status/2028340185902006404
agent-browse上线Electron技能 #9
agent-browser 上线了 Electron 新技能,允许 Agent 绕过视觉识别,通过直接读取 HTML 来控制 Discord、Figma 及 VS Code 等桌面应用。开发者现可通过一条
npx命令将该技能集成至任意编程 Agent 中,即刻实现桌面应用的自动化控制与调试。
agent-browser 发布了 Electron 新技能,允许 Agent 直接控制 Discord、Figma、Notion、Spotify 及 VS Code 等桌面应用。该功能不依赖视觉识别,而是将 Electron 应用视为浏览器,通过读取渲染的 HTML 进行交互,适用于自动化控制及应用调试。开发者可通过 npx skills add vercel-labs/agent-browser --skill electron 命令集成该技能。此外,agent-browser 也支持通过相应命令控制 Slack 客户端。

相关链接:
Anthropic推出免费AI课程 #10
Anthropic 上线了一套完全免费且无需注册的 AI 课程,内容涵盖
Claude Code实战、Agent Skill构建等前沿技术。
Anthropic近日上线一套免费AI课程,无需账号即可通过官网访问并获取证书。课程核心涵盖Claude Code实战、Claude API构建及模型上下文协议MCP全栈开发,包含Agent Skill构建与Amazon Bedrock、Google Vertex AI云平台整合内容。此外,该系列还提供基础AI流利度培训,并专为教育工作者、学生及非营利组织提供定制化课程,旨在帮助不同群体高效、安全地将AI能力融入工作与教学。

相关链接:
Kimi开放平台推出限时充值返券活动 #11
Kimi 开放平台即日起至 3 月 8 日 推出限时充值活动,最高可获赠 40% 代金券。
Kimi开放平台宣布即日起至3月8日推出限时充值活动,用户充值达到不同档位数额可获赠对应20%至40%代金券,券于次日发放且有效期90天。活动重点推广Kimi K2.5多模态模型,得益于Mooncake架构,该模型缓存命中率约90%,使API实际输入价格仅为原定价的25%。

相关链接:
美团推出Tabbit浏览器并陷开源抄袭争议 #12
美团旗下光年之外团队发布AI原生浏览器 Tabbit 并开启公测,该产品基于Chrome内核,用户可通过“全能输入框”调用
Agent自主执行网页任务,国际版内置GPT-5.2、Claude-Sonnet-4.6等多款主流大模型。但产品发布即遭遇争议,被开发者指控违反GPL协议抄袭开源项目陪读蛙。
近日,美团旗下光年之外团队与北京酷讯联合发布AI原生浏览器 Tabbit 并开启公测。该产品基于Chrome内核,集成了智能代理模式与“全能输入框”,支持自主执行网页任务及无代码扩展,国际版内置 GPT-5.2、Claude-Sonnet-4.6 等多款主流大模型。与此同时,开源开发者 mengxi-ream 公开指控 Tabbit 涉嫌抄袭其开源项目“陪读蛙”,称其违反GPL协议使用代码但未开源,目前该事件已在社区引发关于开源合规性的热议。



相关链接:
- https://mp.weixin.qq.com/s/C8Mdb34apUsv-coN2yGx1A
- https://tabbitbrowser.com
- https://github.com/mengxi-ream/read-frog
Anthropic向免费用户开放Claude记忆功能 #13
Anthropic 正式向免费用户开放了 Claude 的记忆功能,同时支持用户导出记忆,或从其他 AI 聊天机器人导入记忆。
Anthropic 官方宣布,Claude 的 Memory 功能现已正式向免费计划用户开放。免费用户现可利用该功能记住用户偏好及历史交互,从而获得更个性化的体验。此次更新重点优化了数据迁移与便携性。官方表示,已简化将保存的 Memory 导入 Claude 的流程。此外,用户拥有完全的数据控制权,可随时导出已保存的内容,确保数据的跨平台可用性。

相关链接:
MiniMax推出移动端MaxClaw #14
MiniMax 移动端 App 正式上线 MaxClaw 功能,实现了与 Web 端的消息同步,用户可在手机端直接与
Agent交互。
MiniMax 官方宣布移动端 App 上线 MaxClaw 功能,支持 Web 端消息同步,用户可直接与 Agent 交互,无需依赖即时通讯软件。

相关链接:
千问发布AI眼镜AI硬件,售价低至1997元 #15
千问首款AI眼镜开启预约,将于3月8日现货发售,G1系列叠加优惠后到手价低至1997元。该产品整机仅重40克,搭载最新
千问大模型,支持3K视频录制、实时翻译及会议记录。
千问正式发布首款 AI 硬件“千问 AI 眼镜”,首发 S1 与 G1 系列。产品现已开启全渠道“0 元预约”,定于 3 月 8 日在中国现货发售,计划年内登陆全球市场。其中 G1 系列标价 2899 元,叠加优惠后低至 1997 元。
该眼镜搭载最新千问大模型,整机重约 40g,支持换电及“手机级”影像技术,具备 3K 视频录制与 AI 4K 输出能力。功能上支持多模态交互、翻译及会议记录。此外,产品将接入千问 App,首批“办事”功能预计 3 月底开放,并计划适配 Spotify、PayPal 等国际生态。

相关链接:
字节跳动联合清华发布CUDA Agent强化学习系统 #16
ByteDance Seed 联合清华大学智能产业研究院推出了名为
CUDA Agent的大规模强化学习系统,旨在通过真实硬件数据反馈自动生成高性能的CUDA Kernel。
ByteDance Seed 联合清华大学 AIR 及 SIA-Lab 发布“CUDA Agent”项目及论文。该系统系大规模 Agentic RL 架构,通过利用真实 GPU Profiling 数据作为奖励信号,生成高性能 CUDA Kernel。项目构建了三阶段数据流水线,产出了含 6000 样本的 CUDA-Agent-Ops-6K 数据集,并采用 ReAct 工作流及分阶段训练策略。官方 KernelBench 数据显示,CUDA Agent 几何平均加速比为 2.11 倍;在 Level-1 和 Level-2 任务中相比 torch.compile 达 100% 加速率,Level-3 任务中达 90%。其表现击败 Claude Opus 4.5 等闭源模型约 40 个百分点。目前代码库与数据集已分别在 GitHub 和 Hugging Face 上线。

相关链接:
MiniMax发布2025财年全年业绩报告 #17
MiniMax发布2025财年业绩,总营收7903.8万美元,同比增长158.9%,其中海外市场贡献约73%。期内毛利率提升至25.4%,经调整净亏损为2.509亿美元,亏损率收窄,现金储备10.5亿美元。
MiniMax(00100.HK)发布上市后首份年报,2025年总收入7903.8万美元,同比增长158.9%,超70%收入源自国际市场。公司毛利增至2010万美元,毛利率提升至25.4%,经调整净亏损2.509亿美元,亏损率同比显著收窄。官方称已完成全模态布局,累计服务用户超2.36亿,最新发布的M2.5模型编程效率提升37%且成本大幅降低。CEO闫俊杰透露截至2026年2月公司ARR已超1.5亿美元,Notion已集成其模型。未来MiniMax将向AI平台型公司迈进。

相关链接:
阿里巴巴统一AI品牌为千问 #18
阿里巴巴宣布将大模型B端品牌和C端应用品牌统一为千问。统一名称之后,阿里巴巴大模型品牌中文为“千问大模型”,英文为“Qwen”。
通义干问的名称将不再使用。
阿里巴巴近日宣布将旗下AI业务品牌矩阵全面统一更名为千问(Qwen),此举标志着其AI战略进入新阶段。据官方公告,原“通义千问”系列更名为千问大模型,C端旗舰应用更名为千问 APP,而“通义实验室”将继续作为AI研发机构专注技术突破。
品牌重塑紧随其后强劲的技术表现。阿里巴巴于除夕开源了Qwen 3.5系列模型,官方显示该系列多款模型包揽了Hugging Face全球开源大模型榜单前四名,已成为全球开发者社区活跃度最高的开源模型之一。
市场应用层面,千问APP表现突出。官方数据显示,其在春节期间处理了近2亿次“一句话下单”指令。根据第三方机构QuestMobile统计,该应用日活跃用户达到7352万,增幅高达940%,位居国内AI类应用前列,显示出强大的用户粘性与市场吸引力。
此外,有行业分析认为,阿里巴巴此次统一品牌旨在通过品牌降维与认知聚合,强化其在开源生态与C端市场的领导地位。随着Qwen 3.5体系的完善,这种从技术领先向品牌生态化的转型,或将重塑国内大模型行业的竞争格局。

相关链接:
智谱Z.ai启动面向AI创业者的扶持计划 #19
智谱 Z.ai 宣布 Startup Program 正式开放申请,入选团队将获得 Free API credits、Priority rate limits 以及 Early API Access 等核心权益。
智谱Z.ai 宣布 Startup Program 现已开放申请,旨在支持 AI-native 初创企业、Agent 构建者、集成 LLM infra 的 SaaS 创始人及构建现实世界规模应用的全球团队。入选团队将获得 Free API credits、Priority rate limits、Exclusive Community 访问权以及 Early API Access 等权益。官方建议正在构建重要产品的团队立即通过 startup.z.ai 提交申请,如有疑问可联系 @ZaiforStartups。

相关链接:
马斯克确认将于今日发布Grok 4.20 Beta 2 #20
xAI 首席执行官 Elon Musk 确认
Grok 4.20 Beta 2将于今日发布,并将同步公开详细的版本说明。
xAI 首席执行官 Elon Musk 确认,Grok 4.20 Beta 2 将于今日发布,并同步公开详细版本说明。此次更新回应了社区对模型迭代的期待,用户重点关注代码能力提升及不同规格模型的发布计划。另据非官方反馈,巴西地区 Grok 服务疑似中断;部分 SuperGrok Heavy 订阅用户在 Grok Build 抢先体验网站提交邮箱时遭遇 HTTP 405 错误,导致无法获取优先访问权限。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。