AI 早报 2026-03-10

视频版哔哩哔哩YouTube

概览

要闻

  • Anthropic 为 Claude Code 推出 Code Review 自动化审查功能 #1

模型发布

  • 小红书开源 FireRed-Image-Edit-1.1 图像编辑模型 #2
  • 小红书 REDtech 发布 REDSearcher 开源深度搜索框架 #3

开发生态

  • JetBrains 宣布 Junie CLI 编码助手正式进入 Beta 测试 #4
  • 吴恩达发布 Context Hub 解决编码 Agent 文档滞后问题 #5
  • OpenRouter 推出应用与智能体排名功能引入请求数统计 #6
  • Gemini CLI 推出极简模式并将优化工具调用显示机制 #7
  • 讯飞星辰 MaaS 平台上线 Coding Plan 订阅服务 #8

产品应用

  • NotebookLM 官方宣布支持上传 ePub 文件作为数据源 #9
  • OpenClaw 发布 2026.3.8 版新增 ACP 认证与备份命令功能 #10
  • 企业微信宣布支持接入 OpenClaw #11
  • Kimi Claw 上线微博企业微信插件 #12
  • 火山引擎正式上线 ArkClaw #13
  • 腾讯正式发布 AI 原生桌面智能体 WorkBuddy #14
  • 微软发布 Copilot Cowork 实现自主任务执行与多模型集成 #15

技术与洞察

  • Karpathy 公开 Agent 调优 nanochat 项目性能提升约 11% #16

行业动态

  • Anthropic 正式起诉 17 个联邦机构及总统行政办公室 #17
  • Nscale 完成 20 亿美元融资估值升至 146 亿美元 #18
  • OpenAI 收购 Promptfoo 整合进 Frontier 平台增强安全测试 #19

前瞻与传闻

  • 传 Google DeepMind 或将发布 Gemma 4 及其他新品 #20
  • 传谷歌在 Gemini 应用中设 0.5 推理努力等级限制 #21
  • 消息称英伟达计划推出 NemoClaw 开源 AI Agent 平台 #22

Anthropic 为 Claude Code 推出 Code Review 自动化审查功能 #1

Anthropic 为 Claude Code 推出了名为 Code Review 的新功能,可自动派出一组 Agent 并行扫描 Pull Request,20分钟完成深度审查,误报率低于 1%,单次成本 15到25美元,目前仅向 TeamEnterprise 计划的用户开放测试。

Anthropic 为 Claude Code 推出代码审查功能 Code Review,以研究预览版形式向 TeamEnterprise 计划用户开放。该功能通过调度多组 Agent 并行查找 PR 中的缺陷,经交叉验证后按严重程度排序,最终以全局评论加逐行标注形式输出结果,平均耗时约 20 分钟,单次费用约 15 至 25 美元。测试显示,PR 获实质性审查评论的比例从 16% 升至 54%,误报率低于 1%;大型 PR 中 84% 发现问题,平均 7.5 个缺陷。该功能定位辅助人工审查,不自动批准 PR,管理员可设置月度支出上限及仓库级开关。

相关链接:


小红书开源 FireRed-Image-Edit-1.1 图像编辑模型 #2

小红书团队更新图像编辑模型 FireRed-Image-Edit,角色身份保持能力达到开源 SOTA 水平,支持十余种元素融合与智能裁剪,代码与模型已全面开源。

小红书近期发布图像编辑模型 FireRed-Image-Edit-1.1,距 1.0 版本上线不足一月。官方称该模型在角色身份保持方面达开源 SOTA 水平,支持10余种元素自由融合及 Agent 智能裁剪拼接,提供数十种人像美妆风格与高保真字体风格参考。工程层面集成模型蒸馏与量化技术,30GB 显存即可实现 4.5秒 端到端生成,原生支持 ComfyUI 节点与 GGUF 格式。项目代码、技术报告、模型权重及训练推理框架已在 GitHub、Hugging Face 及 ModelScope 全面开源,官方数据显示其在 ImgeditGeditRedEdit 等榜单均获领先成绩。

相关链接:


小红书 REDtech 发布 REDSearcher 开源深度搜索框架 #3

小红书 REDtech 团队近日发布深度搜索框架 REDSearcher,官方数据显示,其 30B 参数模型在 BrowseCompGAIA 基准测试中超越 GPT-5-Thinking-high 等模型。该项目代码、论文及数据集已公开。

小红书技术团队 REDtech 近日公布 REDSearcher 项目,旨在突破深度搜索 Agent 训练瓶颈。该框架引入图论树宽和信息分散度量化任务难度,采用 graph-to-text 流程自动化合成高难度数据,支持多模态扩展。训练策略包含两阶段 Mid-Training 强化原子与组合能力,结合 SFTAgentic RL 优化。

官方数据显示,其 30B 参数模型在 BrowseCompGAIA 基准测试中取得开源模型 SoTA 水平,宣称超越 GPT-5-Thinking-highGemini-2.5-pro 等闭源模型。多模态版本 REDSearcher-MM 也在多项基准中超越 Gemini-2.5-pro,部分接近 Gemini-3-pro

目前代码、论文及数据集已对外公开。

相关链接:


JetBrains 宣布 Junie CLI 编码助手正式进入 Beta 测试 #4

JetBrains 发布 Junie CLI 测试版,支持多厂商大模型,可在终端和任意 IDE 中使用。用户可使用自有模型密钥,也提供付费订阅,新用户可享 七天免费试用

JetBrains 近日宣布其编码智能体 Junie CLI 进入 Beta 阶段。该工具打破 IDE 限制,支持在 Terminal、任意 IDE、CI/CD 流水线及 GitHub/GitLab 等全工具链中使用,兼容 OpenAIAnthropicGooglexAI 等厂商顶尖模型。核心功能包括实时提示调整、MCP 一键配置及下一任务预测。

定价采用 BYOK 模式,用户可使用自有模型密钥,无需额外平台费;亦提供 JetBrains AI 许可证订阅,分 AI Pro10 美元/月)、AI Ultimate30 美元/月)、AI Enterprise60 美元/月)三档。新用户可申请 7 天免费试用,含最高 50 美元额度。

工具符合 SOC 2 等安全合规标准。

相关链接:


吴恩达发布 Context Hub 解决编码 Agent 文档滞后问题 #5

吴恩达团队发布了开源工具 Context Hub,为 AI 编程助手提供实时 API 文档,以解决知识过时问题。该工具支持 代码注解长期记忆 功能。

Andrew Ng 及其 DeepLearning.AI 团队近日发布开源工具 Context Hub,旨在解决大语言模型驱动的 Coding Agent 因训练数据滞后而使用过时 API 或产生幻觉参数的问题。该工具通过 chub CLI 为 Agent 提供精选、版本化且针对 LLM 优化的 API 文档,支持按语言筛选以减少 Token 浪费,并引入"自我改进"机制:Agent 可通过 chub annotate 在本地保存技术笔记实现跨会话"长期记忆",通过 chub feedback 向社区反馈文档质量以优化众包知识库。项目基于 MIT 协议开源,内容以 Markdown 形式在 GitHub 维护,开发者可通过 NPM 全局安装并集成到现有智能体工作流。

相关链接:


OpenRouter 推出应用与智能体排名功能引入请求数统计 #6

OpenRouter 推出应用与智能体排名新功能,新增按请求数排名机制,替代传统 Token 统计方式。开发者可自主选择分类加入。

OpenRouter 推出 App & Agent Rankings 功能,支持应用按类别排名及进入热门榜单,新增基于请求数的排名机制以补充传统 Token 统计。官方称,因不同模型 Token 数量差异大,按请求数排名更具实际意义。开发者可自主选择加入并分类内容。当前榜单显示:Hermes Agent 持续热门,Descript 居创意类榜首,OpenClaw 位列"最受欢迎"和"顶级生产力"第一,Claude Code50% 增长率上榜。OpenRouter 联合创始人 Alex Atallah 表示,LLM 应用已从角色扮演演变至 IDE 编码、CLI 编码和个人智能体等多垂直领域并行发展,市场成熟度足以支撑细分排名。

相关链接:


Gemini CLI 推出极简模式并将优化工具调用显示机制 #7

Gemini CLI 上线极简模式,双击 Tab 键即可屏蔽界面噪音,仅保留输入框。开发团队透露,后续还将优化工具调用的显示机制。

Gemini CLI 官方推出"极简模式",用户连按两次 Tab 键即可激活,界面将精简至仅剩 Prompt 输入框。据开发者透露,此为一系列 UX 升级之一,团队还计划优化 tool calls 显示机制,使其更加精简流畅。

相关链接:


讯飞星辰 MaaS 平台上线 Coding Plan 订阅服务 #8

讯飞星辰MaaS平台宣布上线 Coding Plan,入门版首购 3.9元 起。专业版及以上套餐解锁五大国产主流模型,支持 OpenClaw 等工具直接接入。

讯飞星辰 MaaS 平台近日正式上线 Coding Plan 订阅服务,旨在解决开发者运行 OpenClaw 等 AI Agent 时面临的 Token 消耗巨大、并发受限及成本高昂痛点。该服务支持一次订阅解锁 GLM-5MiniMax-M2.5 等五大主流模型,并可直接接入 OpenClawCursor 等编程工具。

平台针对 Coding 场景优化底层算力,支持套餐叠加购买以实现弹性扩容。服务设入门版、专业版及高效版三种规格,首购价格分别为 3.9 元7.9 元39.9 元,每日 Token 调用上限分别为 2000 万1000 万5000 万

目前,用户已可登录平台进行购买及接入。

相关链接:


NotebookLM 官方宣布支持上传 ePub 文件作为数据源 #9

NotebookLM 新增 ePub 文件上传功能,用户可直接导入电子书、小说等资料进行处理。

NotebookLM 官方宣布,该平台现已支持上传 ePub 文件作为数据源。官方称这是用户"请求最多"的功能之一,允许用户将电子书、学习指南及小说等 ePub 格式内容导入处理,旨在让文本资料"鲜活起来",服务偏好阅读的用户群体。

相关链接:


OpenClaw 发布 2026.3.8 版新增 ACP 认证与备份命令功能 #10

AI工具 OpenClaw 发布 2026.3.8 版本,新增用户识别功能和备份命令,修复重复消息及 12 项安全漏洞。

OpenClaw 于近期发布了 2026.3.8 版本更新,本次更新在功能增强方面引入了 ACP provenance 机制。该功能主要致力于提升 Agent 的用户识别能力,确保交互对象的准确性。同时,针对部署过程中的风险控制,OpenClaw 新增了 openclaw backup 命令。这一措施被明确视为部署安全网,旨在应对激进的部署操作,特别是为“YOLO 式部署”提供必要的数据安全保障,防止数据丢失或系统不稳定。

相关链接:


企业微信宣布支持接入 OpenClaw #11

企业微信宣布正式支持接入 OpenClaw,管理员无需配置复杂服务器,仅获取 Bot IDSecret 即可完成配对。新功能支持单聊、群聊、实时双向交互,还能自动写入智能表格。

企业微信宣布正式支持接入 OpenClaw,允许成员与 AI 助手直接对话处理业务。此次更新引入基于“长连接方式”的 API 模式,管理员无需配置复杂域名和服务器,仅需获取 Bot IDSecret 即可完成配对。功能支持单聊、群聊、知识集接入及工作流编排,具备双向交互与实时响应能力,并支持通过 Webhook 协议将数据自动写入智能表格。

相关链接:


Kimi Claw 上线微博企业微信插件 #12

Kimi Claw 已上线微博、企业微信和飞书官方插件,用户可通过这些渠道远程操控执行任务。该功能首批面向 Allegretto 及以上会员开放。

Kimi Claw官方宣布上线「微博」和「企业微信」官方插件,新用户简单设置后即可通过这两款APP远程遥控执行任务,同时支持配置飞书机器人互动。产品支持一键调用ClawHub社区5000多款插件,提供40GB免费云盘空间,并接入专业财经信源实时数据API。该连接功能目前处于早期实验阶段,首批仅向Allegretto及以上会员开放,用户可通过kimi.com/bot入口使用,配置教程已更新至用户手册。

相关链接:


火山引擎正式上线 ArkClaw #13

火山引擎推出云上SaaS版OpenClaw产品 ArkClaw,开箱即用,支持 7×24小时 在线Agent服务。火山方舟 Coding Plan 用户可抢先体验,Pro 用户全周期免费。

火山引擎正式上线云上 SaaS 版 OpenClaw 产品 ArkClaw,旨在解决环境配置复杂及进程中断等痛点,提供 7x24 小时在线 Agent 服务。该产品原生协同 Doubao-Seed-2.0 模型,兼容 Kimi2.5 等主流模型,深度适配飞书插件及即时通讯 APP,具备直连网盘存储及 Skills 安全扫描功能。目前仅面向火山方舟 Coding Plan 用户开放体验,Pro 用户全周期免费,Lite 用户订阅超 7 天可免费体验 7 天。此外,官方将于本周四在北京、上海等七城联动举办线下交流活动。

相关链接:


腾讯正式发布 AI 原生桌面智能体 WorkBuddy #14

腾讯正式发布 AI 桌面智能体 WorkBuddy,兼容 OpenClaw 技能,支持多 Agent 并行处理任务。可连接 企业微信QQ 等远程遥控。新用户可领 5000 Credits 体验。

腾讯正式发布全场景 AI 智能体 WorkBuddy,这是一款免部署的 AI 原生桌面 Agent,官方称解决了 OpenClaw 环境配置复杂痛点并兼容其技能。产品内置超 20 种 Skills 技能包与 MCP 协议,支持多 Agent 并行处理编码等任务,具备完整工作流。用户仅需 1 分钟即可连接企业微信,支持通过 QQ、飞书、钉钉等远程遥控。国内版支持无缝切换 混元DeepSeek 等主流模型,基于腾讯 CodeBuddy 架构提供企业级安全审计。目前产品已开放下载,新用户可无门槛领取 5000 Credits 体验额度。

相关链接:


微软发布 Copilot Cowork 实现自主任务执行与多模型集成 #15

微软宣布发布 Copilot Cowork,用户描述目标后系统自动制定计划并后台执行,支持日历管理、会议材料准备等复杂任务。该功能由 Work IQ 驱动,与 Anthropic 合作集成 Claude 技术,严格遵循企业安全规范。目前正小范围测试,本月下旬将向更多用户开放。

Microsoft官方宣布推出 Copilot Cowork 功能,由 Work IQ 驱动,可将用户意图转化为自主执行动作,标志着 Copilot 从聊天交互向任务自主执行演进。该功能依托 Microsoft 365 数据自动制定计划并在后台执行,通过检查点机制确保用户管控权,可处理日历管理、会议材料生成、企业调研及产品发布计划等复杂任务。

Microsoft 与 Anthropic 合作,将 Claude Cowork 技术集成至 Microsoft 365 Copilot 以实现多模型优势。该功能严格在 Microsoft 365 安全治理边界内运行,默认应用身份权限及合规策略。

目前处于 Research Preview 阶段,仅向部分客户开放,将于本月下旬在 Frontier program 中更广泛推出。

相关链接:


Karpathy 公开 Agent 调优 nanochat 项目性能提升约 11% #16

Andrej Karpathy 分享其在 nanochat 项目中启动使用 autoresearch 调优的实验,Agent 用两天时间找到约 20 项模型优化方案,使性能提升约 11%

Andrej Karpathynanochat项目中启动"autoresearch tuning"实验,Agent对depth=12模型自主运行约两天,完成约700项变更尝试,发现约20项可降低验证损失的改进,包括QKnorm缺失缩放乘数、Value Embeddings缺失正则化、AdamW betas配置错误等人工遗漏问题。这些变更具有叠加性并成功迁移至depth=24模型,使"Time to GPT-2"指标从2.02小时缩短至1.80小时,性能提升约11%。Karpathy称此为LLM前沿实验室的"最终Boss战",认为任何具高效评估指标的问题均可通过Agent群体自动研究,计划开启第二轮实验并探索多Agent协作机制,相关代码已公开于GitHub。

相关链接:


Anthropic 正式起诉 17 个联邦机构及总统行政办公室 #17

据报道,Anthropic 已正式提起诉讼,被告包括 17 个美国联邦机构及总统行政办公室。该诉讼旨在阻止五角大楼将该公司列为供应链风险,从而避免政府实体被禁止采购其服务。

Anthropic向旧金山联邦法院起诉17个美国联邦机构总统行政办公室,指控五角大楼因该公司拒绝移除Claude模型中“禁止致命自主战争”和“禁止大规模监视美国人”两项安全护栏,计划将其列为供应链风险并禁止政府采购。起诉书披露Claude已深度嵌入五角大楼机密系统,并指政府威胁逻辑矛盾:既称将动用《国防生产法》强制接管,又欲将其列入黑名单。Anthropic同时质疑政府援引10 U.S.C. § 3252条款的合法性,该法规本用于应对外国对手破坏活动,不适用于美国本土企业。

相关链接:


Nscale 完成 20 亿美元融资估值升至 146 亿美元 #18

Nscale完成20亿美元C轮融资,估值达146亿美元。资金将用于加速全球基础设施开发,CEO表示最早今年寻求IPO

Nvidia支持的英国AI基础设施公司Nscale完成20亿美元C轮融资,估值达146亿美元,成为欧洲最新"十角兽"。Aker8090 Industries领投,Goldman SachsJPMorgan等参投。CEO Josh Payne称最早或于今年寻求IPO。前Meta COO Sheryl Sandberg、前英国副首相Nick Clegg及前雅虎总裁Susan Decker已加入董事会。

Nscale将全面接管与Aker合资的Stargate Norway项目,计划2026年底部署10万个Nvidia GPUOpenAI为初始客户;另与Microsoft达成协议,将在欧美部署约20万个GPU。上月该公司还以GPU为担保获得14亿美元债务融资。

相关链接:


OpenAI 收购 Promptfoo 整合进 Frontier 平台增强安全测试 #19

OpenAI 宣布收购 AI 安全平台 Promptfoo,将其技术整合进 Frontier 平台,用于增强企业级 AI Agent 的安全测试能力。收购完成后其开源项目将继续维护。

OpenAI 宣布收购 AI 安全平台 Promptfoo,交易尚待惯例成交条件满足。Promptfoo 技术将整合进 OpenAI Frontier 平台,为企业级 AI Agent 提供自动化红队测试能力,覆盖提示注入、越狱及数据泄露等风险。该平台由 Ian WebsterMichael D'Angelo 创立,产品获超 25% 财富 500 强企业使用。OpenAI 承诺收购完成后继续维护其开源项目并服务现有客户。据 Pitchbook 数据,Promptfoo 成立于 2024 年,累计融资 2300 万美元,20257 月估值 8600 万美元,交易金额未披露。

相关链接:


传 Google DeepMind 或将发布 Gemma 4 及其他新品 #20

谷歌 DeepMind 员工暗示本周密集发布新品。GitHub 已现 Gemma 4 踪迹,疑似官方机器人账号提交。消息称其 Gemma 4 最大模型总参数量约 120B,激活参数 15B

Google DeepMind 员工 Logan Kilpatrick 本周暗示将迎来密集新品发布。社区同时在 GitHub 发现 Gemma 4 踪迹,相关提交记录疑似源自 Google 官方机器人账号。据非官方消息,Gemma 4 最大模型总参数量可能约为 120B,激活参数量约 15B。外界推测本周发布还可能包括 Gemini 系列的更新。

相关链接:


传谷歌在 Gemini 应用中设 0.5 推理努力等级限制 #21

谷歌被曝在 Gemini 应用中暗藏系统指令,将默认推理努力程度锁定为 0.5,对应 APIAI Studio 中的 "中等" 档位。目前该设定覆盖免费版、Pro 版及 Ultra 版用户,仅 Canvas 模式例外。

据社交媒体用户 Chetaslua 披露,Google 疑似在 Gemini 应用中植入隐藏系统提示词,将默认"推理努力程度"设定为 0.5。该参数对应 API 和 AI Studio 中的 "中等" 档位,低于无限制时的 "高" 档位默认值。目前该设定覆盖免费版、Pro 版及 Ultra 版用户,Gemini Pro 模型及用户自定义 Gems 均受影响,Canvas 模式或为唯一例外。

相关链接:


消息称英伟达计划推出 NemoClaw 开源 AI Agent 平台 #22

据报道,英伟达计划推出开源AI Agent平台 NemoClaw。该平台跨硬件兼容,无需英伟达芯片即可运行,并内置安全工具解决企业应用风险。

据 WIRED 援引知情人士消息,Nvidia 正计划推出代号为 NemoClaw 的开源 AI Agent 平台,已向 SalesforceCiscoGoogleAdobeCrowdStrike 等企业推介,拟在年度开发者大会前后公布。该平台支持跨硬件兼容,非 Nvidia 芯片用户亦可访问,旨在帮助企业部署 AI Agent 执行劳动力任务,并内置安全与隐私工具以应对 Agent 技术的不可预测性与风险。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误