AI 早报 2026-03-03

视频版哔哩哔哩YouTube

概览

要闻

  • 千问团队开源Qwen3.5小尺寸模型系列 #1
  • 智谱 GLM Coding Plan 套餐开启退款通道 #2

模型发布

  • 阶跃星辰开源Step 3.5 Flash模型及训练框架 #3
  • IQuestLab开源IQuest-Coder-V1系列代码模型权重 #4
  • 小红书开源FireRed-OCR模型 #5
  • 通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 #6
  • Jan团队发布 Jan-Code-4B 模型 #7

开发生态

  • OpenClaw发布2026.3.1版本 #8
  • agent-browse上线Electron技能 #9
  • Anthropic推出免费AI课程 #10
  • Kimi开放平台推出限时充值返券活动 #11

产品应用

  • 美团推出Tabbit浏览器并陷开源抄袭争议 #12
  • Anthropic向免费用户开放Claude记忆功能 #13
  • MiniMax推出移动端MaxClaw #14
  • 千问发布AI眼镜AI硬件,售价低至1997元 #15

技术与洞察

  • 字节跳动联合清华发布CUDA Agent强化学习系统 #16

行业动态

  • MiniMax发布2025财年全年业绩报告 #17
  • 阿里巴巴统一AI品牌为千问 #18
  • 智谱Z.ai启动面向AI创业者的扶持计划 #19

前瞻与传闻

  • 马斯克确认将于今日发布Grok 4.20 Beta 2 #20

千问团队开源Qwen3.5小尺寸模型系列 #1

Qwen 团队正式发布了 Qwen 3.5 小模型系列,涵盖 0.8B2B4B9B 四款模型,该系列模型在多项评测中创下同等尺寸性能新高。其中,0.8B2B 模型体积小巧、速度快,适合边缘设备计算。4B 模型被定位为轻量级 Agent 的强力多模态底座。9B 模型则在紧凑体积下大幅缩小了与更大参数模型的能力差距。

千问团队正式开源 Qwen3.5 小尺寸模型系列,涵盖 0.8B2B4B9B 四款模型,家族矩阵扩至8款。新模型基于原生多模态基座,融合 Gated Delta Networks 与稀疏 MoE 架构,原生支持 262K 上下文并可扩展至 1M+。系列采用 Apache 2.0 协议,同步开源基座与对话模型。其中 0.8B/2B 主打端侧部署,默认非思考模式;4B 定位轻量 Agent9B 宣称具备越级性能。目前模型已登陆 HF、魔搭及 Ollama,官方数据显示其在多模态及 Agent 基准测试中表现优异。

相关链接:


智谱 GLM Coding Plan 套餐开启退款通道 #2

智谱 GLM Coding Plan 套餐现已开启退款通道,2025年12月19日前购买的用户需手动提交工单办理。

据社区用户反馈,智谱GLM Coding Plan退款通道开启,2025年12月19日前购买需手动提交工单。


阶跃星辰开源Step 3.5 Flash模型及训练框架 #3

阶跃星辰正式开源 Step 3.5 Flash 基础及中间训练版模型,同步公开了仅需 PyTorch 依赖的 SteptronOSS 训练框架,两者均遵循 Apache 2.0 协议。

阶跃星辰 StepFun 宣布开源 Step 3.5 Flash 模型基础版与中间训练版,同步公开训练代码库 SteptronOSS。该模型采用稀疏 MoE 架构,总参数 196B,激活 11B,支持 256K 上下文。引入多Token预测技术,生成吞吐量峰值达 350 tok/s。官方数据显示,其在 SWE-bench VerifiedTerminal-Bench 2.0 上分别达 74.4%51.0%SteptronOSS 框架支持 SFTRLVR 及评估,仅需 PyTorch 运行。模型权重已上线 Hugging Face,采用 Apache 2.0 协议,SFT 数据集后续发布。

相关链接:


IQuestLab开源IQuest-Coder-V1系列代码模型权重 #4

IQuestLab 已正式在 Hugging Face 上开源 IQuest-Coder-V1 全系列模型权重,涵盖 7B40BThinking 等多个版本。

IQuestLab 正式开源并上传 IQuest-Coder-V1 系列模型权重至 Hugging Face,涵盖 7B14B(Base、Instruct、Thinking 变体)及 40B Thinking、40B-Loop-Thinking 实验变体,面向自主软件工程与代码智能领域。

该系列模型采用浅层架构设计,据官方说明,其在 7B14B 规模下可实现 3-5 倍的推理加速。训练方面,模型应用 Code-Flow 训练范式,从代码仓库的演化模式、Commit 迁移中学习。在后训练阶段,通过分叉式策略衍生出专精模型:Thinking 版本基于推理驱动的强化学习解决复杂编程问题;Instruct 版本侧重通用代码协作。作为实验性原型,40B-Loop-Thinking 采用循环 Transformer 设计,旨在探索嵌套式推理机制。

相关链接:


小红书开源FireRed-OCR模型 #5

小红书 REDtech 团队开源了 FireRed-OCR 模型,该模型基于 Qwen3-VL-2B 架构,在文本识别、公式解析及表格重构等关键指标上全面领先。

小红书 REDtech 团队近日宣布开源基于 Qwen3-VL-2B 架构的智能文档处理模型 FireRed-OCR,旨在解决视觉语言模型在复杂文档处理中的“结构性幻觉”问题。该模型首创“三阶段渐进优化”策略与“几何+语义”数据工厂,显著提升了结构化解析能力。

官方数据显示,在 OmniDocBench v1.5 评测中,FireRed-OCR92.94% 的综合准确率刷新纪录,成为首个突破 92% 阈值的端到端模型。其在文本识别、公式解析、表格重构及阅读顺序等细分指标上均表现优异。目前,该模型已在 GitHubHugging FaceModelScope 等平台全面开源。

相关链接:


通义实验室发布Fun-CosyVoice 3.5 与 Fun-AudioGen-VD 两款语音模型 #6

阿里通义实验室发布了 Fun-CosyVoice 3.5Fun-AudioGen-VD 两款语音模型。前者专注多语种复刻与精细化控制,后者定位全场景声音设计,支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前,两款模型均已开放 API 调用。

阿里通义实验室发布 Fun-CosyVoice3.5Fun-AudioGen-VD 两款语音模型,支持 FreeStyle 指令生成。Fun-CosyVoice3.5 专注多语种复刻与精细化控制,引入 DiffROGRPO 技术,使生僻字读错率从 15.2% 降至 5.3%,首包延迟降低 35%,新增泰语等四个语种。Fun-AudioGen-VD 定位全场景声音设计,支持通过自然语言生成包含性别、情绪及空间声学效果的“人物+场景”音频。目前两模型均已提供 API 调用。

相关链接:


Jan团队发布 Jan-Code-4B 模型 #7

Jan团队发布了基于 Qwen3 架构的40亿参数代码模型 Jan-Code-4B,该模型主打本地低延迟运行。

Jan团队近日发布40亿参数代码调优模型 Jan-Code-4B,底层架构源自 Qwen3-4B-Instruct-2507。该模型专为本地低延迟迭代设计,旨在作为轻量级编程助手或Agent工作流中的快速Worker,替代Claude Code设置中的 Haiku 模型。

相关链接:


OpenClaw发布2026.3.1版本 #8

OpenClaw 发布 2026.3.1 版本。此次更新重点引入了 OpenAI WebSocketClaude 4.6 自适应思考,显著改善了容器化部署支持,并推出了 Agent 驱动的可视化差异插件。同时,其 GitHub Star 数已超过 React

OpenClaw 正式发布 2026.3.1 版本,新版本引入 OpenAI WebSocket streaming,支持 Claude 4.6 adaptive thinking,并显著优化了 Docker 及 Native K8s 体验。生态集成上,新增 Discord threads 支持,修复 Feishu 相关问题,并推出 Agent 驱动的 visual diffs plugin。此外,其 GitHub Star 数已超越 React

相关链接:


agent-browse上线Electron技能 #9

agent-browser 上线了 Electron 新技能,允许 Agent 绕过视觉识别,通过直接读取 HTML 来控制 DiscordFigmaVS Code 等桌面应用。开发者现可通过一条 npx 命令将该技能集成至任意编程 Agent 中,即刻实现桌面应用的自动化控制与调试。

agent-browser 发布了 Electron 新技能,允许 Agent 直接控制 DiscordFigmaNotionSpotifyVS Code 等桌面应用。该功能不依赖视觉识别,而是将 Electron 应用视为浏览器,通过读取渲染的 HTML 进行交互,适用于自动化控制及应用调试。开发者可通过 npx skills add vercel-labs/agent-browser --skill electron 命令集成该技能。此外,agent-browser 也支持通过相应命令控制 Slack 客户端。

相关链接:


Anthropic推出免费AI课程 #10

Anthropic 上线了一套完全免费且无需注册的 AI 课程,内容涵盖 Claude Code 实战、Agent Skill 构建等前沿技术。

Anthropic近日上线一套免费AI课程,无需账号即可通过官网访问并获取证书。课程核心涵盖Claude Code实战、Claude API构建及模型上下文协议MCP全栈开发,包含Agent Skill构建与Amazon BedrockGoogle Vertex AI云平台整合内容。此外,该系列还提供基础AI流利度培训,并专为教育工作者、学生及非营利组织提供定制化课程,旨在帮助不同群体高效、安全地将AI能力融入工作与教学。

相关链接:


Kimi开放平台推出限时充值返券活动 #11

Kimi 开放平台即日起至 3 月 8 日 推出限时充值活动,最高可获赠 40% 代金券。

Kimi开放平台宣布即日起至3月8日推出限时充值活动,用户充值达到不同档位数额可获赠对应20%40%代金券,券于次日发放且有效期90天。活动重点推广Kimi K2.5多模态模型,得益于Mooncake架构,该模型缓存命中率约90%,使API实际输入价格仅为原定价的25%

相关链接:


美团推出Tabbit浏览器并陷开源抄袭争议 #12

美团旗下光年之外团队发布AI原生浏览器 Tabbit 并开启公测,该产品基于Chrome内核,用户可通过“全能输入框”调用Agent自主执行网页任务,国际版内置GPT-5.2Claude-Sonnet-4.6等多款主流大模型。但产品发布即遭遇争议,被开发者指控违反GPL协议抄袭开源项目陪读蛙

近日,美团旗下光年之外团队与北京酷讯联合发布AI原生浏览器 Tabbit 并开启公测。该产品基于Chrome内核,集成了智能代理模式与“全能输入框”,支持自主执行网页任务及无代码扩展,国际版内置 GPT-5.2Claude-Sonnet-4.6 等多款主流大模型。与此同时,开源开发者 mengxi-ream 公开指控 Tabbit 涉嫌抄袭其开源项目“陪读蛙”,称其违反GPL协议使用代码但未开源,目前该事件已在社区引发关于开源合规性的热议。

相关链接:


Anthropic向免费用户开放Claude记忆功能 #13

Anthropic 正式向免费用户开放了 Claude 的记忆功能,同时支持用户导出记忆,或从其他 AI 聊天机器人导入记忆。

Anthropic 官方宣布,ClaudeMemory 功能现已正式向免费计划用户开放。免费用户现可利用该功能记住用户偏好及历史交互,从而获得更个性化的体验。此次更新重点优化了数据迁移与便携性。官方表示,已简化将保存的 Memory 导入 Claude 的流程。此外,用户拥有完全的数据控制权,可随时导出已保存的内容,确保数据的跨平台可用性。

相关链接:


MiniMax推出移动端MaxClaw #14

MiniMax 移动端 App 正式上线 MaxClaw 功能,实现了与 Web 端的消息同步,用户可在手机端直接与 Agent 交互。

MiniMax 官方宣布移动端 App 上线 MaxClaw 功能,支持 Web 端消息同步,用户可直接与 Agent 交互,无需依赖即时通讯软件。

相关链接:


千问发布AI眼镜AI硬件,售价低至1997元 #15

千问首款AI眼镜开启预约,将于3月8日现货发售,G1系列叠加优惠后到手价低至1997元。该产品整机仅重40克,搭载最新千问大模型,支持3K视频录制、实时翻译及会议记录。

千问正式发布首款 AI 硬件“千问 AI 眼镜”,首发 S1 与 G1 系列。产品现已开启全渠道“0 元预约”,定于 3 月 8 日在中国现货发售,计划年内登陆全球市场。其中 G1 系列标价 2899 元,叠加优惠后低至 1997 元

该眼镜搭载最新千问大模型,整机重约 40g,支持换电及“手机级”影像技术,具备 3K 视频录制与 AI 4K 输出能力。功能上支持多模态交互、翻译及会议记录。此外,产品将接入千问 App,首批“办事”功能预计 3 月底开放,并计划适配 Spotify、PayPal 等国际生态。

相关链接:


字节跳动联合清华发布CUDA Agent强化学习系统 #16

ByteDance Seed 联合清华大学智能产业研究院推出了名为 CUDA Agent 的大规模强化学习系统,旨在通过真实硬件数据反馈自动生成高性能的 CUDA Kernel

ByteDance Seed 联合清华大学 AIRSIA-Lab 发布“CUDA Agent”项目及论文。该系统系大规模 Agentic RL 架构,通过利用真实 GPU Profiling 数据作为奖励信号,生成高性能 CUDA Kernel。项目构建了三阶段数据流水线,产出了含 6000 样本的 CUDA-Agent-Ops-6K 数据集,并采用 ReAct 工作流及分阶段训练策略。官方 KernelBench 数据显示,CUDA Agent 几何平均加速比为 2.11 倍;在 Level-1 和 Level-2 任务中相比 torch.compile100% 加速率,Level-3 任务中达 90%。其表现击败 Claude Opus 4.5 等闭源模型约 40 个百分点。目前代码库与数据集已分别在 GitHubHugging Face 上线。

相关链接:


MiniMax发布2025财年全年业绩报告 #17

MiniMax发布2025财年业绩,总营收7903.8万美元,同比增长158.9%,其中海外市场贡献约73%。期内毛利率提升至25.4%,经调整净亏损为2.509亿美元,亏损率收窄,现金储备10.5亿美元

MiniMax(00100.HK)发布上市后首份年报,2025年总收入7903.8万美元,同比增长158.9%,超70%收入源自国际市场。公司毛利增至2010万美元,毛利率提升至25.4%,经调整净亏损2.509亿美元,亏损率同比显著收窄。官方称已完成全模态布局,累计服务用户超2.36亿,最新发布的M2.5模型编程效率提升37%且成本大幅降低。CEO闫俊杰透露截至2026年2月公司ARR已超1.5亿美元,Notion已集成其模型。未来MiniMax将向AI平台型公司迈进。

相关链接:


阿里巴巴统一AI品牌为千问 #18

阿里巴巴宣布将大模型B端品牌和C端应用品牌统一为千问。统一名称之后,阿里巴巴大模型品牌中文为“千问大模型”,英文为“Qwen”。通义干问的名称将不再使用。

阿里巴巴近日宣布将旗下AI业务品牌矩阵全面统一更名为千问(Qwen),此举标志着其AI战略进入新阶段。据官方公告,原“通义千问”系列更名为千问大模型,C端旗舰应用更名为千问 APP,而“通义实验室”将继续作为AI研发机构专注技术突破。

品牌重塑紧随其后强劲的技术表现。阿里巴巴于除夕开源了Qwen 3.5系列模型,官方显示该系列多款模型包揽了Hugging Face全球开源大模型榜单前四名,已成为全球开发者社区活跃度最高的开源模型之一。

市场应用层面,千问APP表现突出。官方数据显示,其在春节期间处理了近2亿次“一句话下单”指令。根据第三方机构QuestMobile统计,该应用日活跃用户达到7352万,增幅高达940%,位居国内AI类应用前列,显示出强大的用户粘性与市场吸引力。

此外,有行业分析认为,阿里巴巴此次统一品牌旨在通过品牌降维与认知聚合,强化其在开源生态与C端市场的领导地位。随着Qwen 3.5体系的完善,这种从技术领先向品牌生态化的转型,或将重塑国内大模型行业的竞争格局。

相关链接:


智谱Z.ai启动面向AI创业者的扶持计划 #19

智谱 Z.ai 宣布 Startup Program 正式开放申请,入选团队将获得 Free API creditsPriority rate limits 以及 Early API Access 等核心权益。

智谱Z.ai 宣布 Startup Program 现已开放申请,旨在支持 AI-native 初创企业、Agent 构建者、集成 LLM infraSaaS 创始人及构建现实世界规模应用的全球团队。入选团队将获得 Free API creditsPriority rate limitsExclusive Community 访问权以及 Early API Access 等权益。官方建议正在构建重要产品的团队立即通过 startup.z.ai 提交申请,如有疑问可联系 @ZaiforStartups

相关链接:


马斯克确认将于今日发布Grok 4.20 Beta 2 #20

xAI 首席执行官 Elon Musk 确认 Grok 4.20 Beta 2 将于今日发布,并将同步公开详细的版本说明。

xAI 首席执行官 Elon Musk 确认,Grok 4.20 Beta 2 将于今日发布,并同步公开详细版本说明。此次更新回应了社区对模型迭代的期待,用户重点关注代码能力提升及不同规格模型的发布计划。另据非官方反馈,巴西地区 Grok 服务疑似中断;部分 SuperGrok Heavy 订阅用户在 Grok Build 抢先体验网站提交邮箱时遭遇 HTTP 405 错误,导致无法获取优先访问权限。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误