2026-04-09

AI 早报 2026-04-09
概览
要闻
- Meta 发布 Muse Spark 模型,比肩顶级竞品 ↗
#1 - Anthropic 发布 Claude Managed Agents 公测版 ↗
#2 - Google 为 Gemini 引入 Notebooks 功能并与 NotebookLM 同步 ↗
#3
模型发布
- 爱诗科技上线 PixVerse C1 视频生成模型 ↗
#4 - Black Forest Labs 发布 FLUX.2 Small Decoder ↗
#5 - Liquid AI 发布 LFM2.5-VL-450M 边缘视觉语言模型 ↗
#6
开发生态
产品应用
- Adobe 推出 Student Spaces 测试版,AI 辅助学生学习 ↗
#9 - 腾讯云发布国内首个浏览器 QBotClaw 支持自然语言指令 ↗
#10 - Google 新版 AI Finance 开放覆盖全球 100 多个国家和地区 ↗
#11
技术与洞察
- Mercor 发布 APEX-Agents 基准 ↗
#12
行业动态
前瞻与传闻
Meta 发布 Muse Spark 模型,比肩顶级竞品 #1
Meta Superintelligence Labs 发布了重构技术栈后的首款原生多模态推理模型
Muse Spark。该模型引入了深度推理模式,在视觉及科学任务上比肩顶级竞品。目前该模型已上线 meta.ai 并集成至旗下所有社交平台,并通过私有 API 向特定合作伙伴开放。
官方表示计划在未来开源后续版本。
Meta Superintelligence Labs (MSL) 正式发布了 Muse 系列的首款大语言模型 Muse Spark。官方公告显示,这是该实验室在过去九个月从零重建 AI 技术栈后的首个产品,定位为迈向个人超级智能的基础模型。
该原生多模态推理模型支持工具使用、视觉思维链和多智能体编排。据媒体与独立评测机构 Artificial Analysis 报道,这是 Meta 首个未提供开源权重的前沿模型,其在 Intelligence Index 中获得 52 分,跻身前五,在视觉与 token 效率方面表现优异,但在部分 Agentic 评测中稍显逊色。
官方为其推出了并行推理的 Contemplating 模式,并已在 meta.ai 和 Meta AI app 中上线该模型。目前,该模型支持启动多个子 Agent 协同处理复杂任务、结合视觉感知进行健康数据分析以及提供个性化购物建议。
官方已向特定合作伙伴开放私有 API 预览,并计划在未来几周内将相关功能推广至 WhatsApp、Instagram、Facebook、Messenger 及 AI 眼镜等全平台生态。官方还表示,计划在未来开源后续版本。


相关链接:
- https://ai.meta.com/blog/introducing-muse-spark-msl/
- https://about.fb.com/news/2026/04/introducing-muse-spark-meta-superintelligence-labs/
Anthropic 发布 Claude Managed Agents 公测版 #2
Anthropic 发布了 Claude Managed Agents,这是一套用于大规模构建和部署 Agent 的托管式 API,旨在解决传统生产级 Agent 开发中基础设施搭建耗时数月的问题。
该服务将性能优化的
Agent harness与生产级基础设施相整合,开发者只需定义任务、工具和护栏,基础设施则交由 Anthropic 云端管理,从而实现快速从原型推向上线。
Anthropic 宣布其托管式 Agent 构建与部署服务 Claude Managed Agents 现已进入公测阶段。该服务旨在通过将性能优化的 Agent harness 与生产级基础设施相配合,解决开发者自建生产级 Agent 基础设施耗时数月的问题,使开发者仅需定义任务、工具和护栏,即可在数天内实现从原型到上线。
Claude Managed Agents 核心采用了将“大脑”(Claude 及其 harness)与“双手”(沙箱和执行工具)以及“会话”(事件日志)解耦的架构设计,这不仅优化了容错性和安全性,还将首个 Token 延迟(TTFT)的 p50 耗时缩短了约 60%、p95 缩短超 90%。
根据官方博客,在内部测试的结构化文件生成任务中,该服务的成功率比标准提示循环高出最多 10 个百分点。
在计费方面,其 Token 费用按 Claude 平台标准收取,并对活跃会话按每小时 0.08 美元 计费。
目前,Notion、Sentry、Asana、Rakuten 等多家企业已将其应用于并行任务处理、自动化代码修复和内部专用 Agent 部署等场景。


相关链接:
- https://platform.claude.com/docs/en/managed-agents/overview
- https://www.anthropic.com/engineering/managed-agents
- https://x.com/claudeai/status/2041927687460024721
Google 为 Gemini 引入 Notebooks 功能并与 NotebookLM 同步 #3
Google 现已在 Gemini 应用中正式推出 Notebooks 功能,用户现可在侧边栏创建专属空间,不仅能将过往对话移入其中、添加自定义指令及相关文档和 PDF 文件,还能直接访问所有个人的、未共享的笔记本,并能实现跨平台无缝使用
NotebookLM独有的Video Overviews等功能。该功能目前面向 Web 端付费订阅用户开放,并计划在未来几周扩展至移动端及免费用户。
Google 官方博客与 NotebookLM 官方社交账号最新宣布,在 Gemini 应用中正式引入 Notebooks 功能,将其与 AI 研究助手 NotebookLM 深度打通,构建一个跨产品的个人知识库,以帮助用户轻松追踪和管理复杂项目。
用户现可在 Gemini 应用侧边栏点击“New notebook”创建专属空间,不仅能将过往对话移入其中、添加自定义指令及相关文档和 PDF 文件,还能直接访问所有个人的、未共享的笔记本,并将与 Gemini 的聊天记录作为来源应用于新的或现有的未共享笔记本中。
该功能实现了跨应用的双向自动同步,在一端添加的源文件会自动出现在另一端。用户可根据其订阅计划使用更多的来源数量,并跨平台无缝使用 NotebookLM 独有的 Video Overviews、Infographics 和 Cinematic Video Overview 等功能。
官方表示,这项功能目前已面向 Web 端的 Google AI Ultra、Pro 和 Plus 订阅用户推出,并将在未来几周内逐步扩展至移动端、更多欧洲国家及免费用户。


相关链接:
- https://blog.google/innovation-and-ai/products/gemini-app/notebooks-gemini-notebooklm/
- https://x.com/NotebookLM/status/2041982449387810962
爱诗科技上线 PixVerse C1 视频生成模型 #4
爱诗科技正式上线了定位为影视行业大模型的
PixVerse C1,支持将分镜图一键转化为连续成片,并具备复杂场景下的多角色精准调度能力。
近日,爱诗科技正式上线了 PixVerse C1 视频生成模型。该模型定位为“全球首个影视行业大模型”,主要服务于影视、动漫及短漫剧行业。
PixVerse C1 支持文生视频、图生视频、参考生视频及首尾帧生成等多种能力,最高可生成15秒的1080P视频,并实现音画同步出片。
此外,该模型具备跟随提示词指令自动分镜的功能,支持将多宫格分镜图一键转化为连续成片。
目前,PixVerse C1 已全面登陆 PixVerse Web 端及 API 平台供用户体验。

相关链接:
Black Forest Labs 发布 FLUX.2 Small Decoder #5
Black Forest Labs 推出了 FLUX.2 Small Decoder,通过减少参数量将解码速度提升约 1.4 倍,同时降低 40% 的显存占用,且画质几乎无损,兼容所有 FLUX.2 模型。
Black Forest Labs 正式发布了 FLUX.2 Small Decoder,作为标准 FLUX.2 解码器的直接替代方案。官方表示,该解码器通过将参数量从约 50M 缩减至约 28M,实现了约 1.4 倍的解码速度提升,并将解码时的峰值显存占用降低了约 1.4 倍,且图像质量损失极小。
该技术不仅与所有开放的 FLUX.2 模型开箱即用,尤其对实时处理和更高分辨率的图像生成管线具有显著影响。
目前,该模型已在 Hugging Face 平台提供,并采用 Apache 2.0 协议开源。

相关链接:
Liquid AI 发布 LFM2.5-VL-450M 边缘视觉语言模型 #6
Liquid AI 发布了边缘部署专用视觉语言模型
LFM2.5-VL-450M,具备 4 FPS 视频实时推理能力,并新增了边界框预测、多语言理解及Function calling支持。
Liquid AI 发布视觉语言模型 LFM2.5-VL-450M。据官方博客,该模型专为边缘部署设计,处理 512×512 图像仅需 240 毫秒,支持 4 FPS 视频流实时推理。
基于前代构建,新增边界框预测(RefCOCO-M 得分 81.28)、9 种语言理解(MMMB 得分从 54.29 提升至 68.09)及 Function calling 支持。
官方称其可单次运行完成设备端定位、推理及结构化输出。
支持 Jetson Orin、手机等设备,开放权重已上线 Hugging Face 等平台。

相关链接:
OpenClaw 连发 v2026.4.7 和 v2026.4.8 两版 #7
OpenClaw v2026.4.7 版本上线,引入了
openclaw infer,Webhook 驱动TaskFlow以及兼容 Obsidian 的memory-wiki功能。但因 NPM 打包缺陷导致部分扩展无法加载并阻断启动,随后通过 v2026.4.8 版本修复了相关问题。
OpenClaw 官方近日推出了 v2026.4.7 版本,引入了无头推理中心 openclaw infer、由 Webhook 驱动的 TaskFlow、支持 Obsidian 的 memory-wiki 等多项新功能。
然而,该版本在发布后被发现存在严重的 NPM 打包缺陷,导致包括 Tg 和 Slack 在内的扩展加载失败并阻断程序启动。
针对此问题,OpenClaw 团队迅速更新了发布验证脚本,并将版本迭代至 v2026.4.8,修复了因打包路径缺失导致的扩展加载错误、Slack 代理连接及 bot token 验证等多项底层问题。
尽管官方反应迅速,仍有社区用户反馈在升级过程中遇到了依赖缺失、控制台报错及网关无法重启等体验问题,并呼吁官方提供长期支持(LTS)版本。


相关链接:
- https://github.com/openclaw/openclaw/releases/tag/v2026.4.8
- https://x.com/openclaw/status/2041759063428460762
Google Colab 新增自定义指令及学习模式 #8
Google Colab 新增 Custom Instructions 与 Learn Mode 功能。前者支持用户保存上下文偏好以定制专属 AI 助手;后者则支持通过分步指导而帮助用户深度理解技术概念并提升开发能力。
Google Colab 宣布扩展其 Gemini 集成,全新引入 Custom Instructions 与 Learn Mode 两项功能,旨在赋予用户对其 Gemini Agent 运作方式及辅助学习方式的更多控制权。
其中,Custom Instructions 允许在 notebook 级别存储上下文偏好,用户可直接在聊天框中切换并保存设置。
而 Learn Mode 则基于 Custom Instructions 运行,该模式将 Gemini 转化为个人编码导师,不再直接提供可复制粘贴的代码块来解决问题,而是通过分步指导分解复杂主题并解释底层概念,以培养用户的实际开发技能。

相关链接:
Adobe 推出 Student Spaces 测试版,AI 辅助学生学习 #9
Adobe 推出了 Student Spaces in Acrobat,利用
AI将课堂笔记和文档一键转化为学习指南、思维导图及音频摘要,辅助学生学习。目前已开放免费体验。
为了帮助学生群体应对繁忙的课业、考试准备、小组项目以及实习和职业规划,Adobe 推出了名为 Student Spaces in Acrobat 的全新免费测试版工具。该功能旨在为上述群体提供一个专属的平台,以实现更快速、更轻松且更高效的学习。
Student Spaces 允许用户将课堂笔记、文档和链接转化为学习指南、思维导图、互动式抽认卡和测验。该平台内置了全天候 24/7 在线的 AI Assistant,可提供带有交互式引用的解释以供验证。
同时,该产品支持多种学习偏好,不仅支持将笔记转化为简短的音频摘要或深度播客以供听觉学习,还支持邀请学习小组进行实时协作,并提供专注模式供独立学习使用。
目前,该功能已开放免费体验。

相关链接:
- https://blog.adobe.com/en/publish/2026/04/07/learn-acrobat-class-career-prep-made-easier-with-new-student-spaces
- https://acrobat.adobe.com/studentspaces/home
腾讯云发布国内首个浏览器 QBotClaw 支持自然语言指令 #10
腾讯云发布浏览器自动化工具 “龙虾”
QBotClaw,用户只需在 QQ浏览器 电脑端侧边栏点击 “AI” 按钮即可免费使用。目前 Mac 版本已率先上线。
腾讯云正式发布了国内首个浏览器“龙虾”QBotClaw。该产品允许用户通过QQ浏览器电脑端的侧边栏“AI”按钮直接启用。
目前其首期已上线Mac版本,Windows版本将于近期推出。
QBotClaw完全兼容OpenClaw技能,并支持用户自由配置国内各大主流大模型的API Key。
在功能上,这款浏览器能够根据自然语言指令自动执行跨平台比价、多平台自动发帖等复杂任务,并具备文件操作、执行命令、浏览器自动化和信息搜索四大核心能力。
其内置了自研的QQ浏览器Skill,以精准识别动态网页元素,且基于整个浏览器运行具备深度记忆能力,可全面掌握当前网页、账号及文件等上下文信息。
此外,该产品支持通过微信Clawbot扫码直连,实现了移动端对电脑端的远程控制。
为确保数据安全,官方构建了包含安全沙箱隔离、指令Markdown约束及SkillHub认证机制的三维安全防护。

相关链接:
Google 新版 AI Finance 开放覆盖全球 100 多个国家和地区 #11
Google 宣布以 AI 为核心的新版 Google Finance 将在未来几周扩展至全球 100 多个国家和地区。该服务允许用户利用
AI 助手分析复杂市场动态,通过高级图表进行可视化研判。
Google 官方宣布,以 AI 为核心的新版 Google Finance 正式走向全球,并将在未来几周内向 100 多个国家/地区推出。此前,这项重塑后的服务已在美国和印度上线,此次扩展将覆盖澳大利亚、巴西、加拿大、印度尼西亚、日本和墨西哥等地,并提供完整的本地语言支持。
该产品集成了多项核心功能:用户可利用 AI 提出从复杂市场动态到个股详情的问题,并获得附带相关链接的综合回复;通过引入移动平均包络线和蜡烛图等高级图表工具进行深入的可视化分析;利用改版后的新闻源以及扩充的大宗商品数据获取实时情报。
此外,还支持通过实时音频、同步文本记录以及 AI 生成的洞察来跟进企业财报电话会议。

相关链接:
- https://blog.google/products-and-platforms/products/search/google-finance-expansion/
- https://finance.google.com/beta
Mercor 发布 APEX-Agents 基准 #12
Mercor 推出了 APEX-Agents 基准测试及开源数据集,通过投行、咨询和法律领域的 480 项专家任务,评估 AI Agent 在长周期跨应用工作中的表现。
基于此,Artificial Analysis 上线了 APEX-Agents-AA 排行榜。
近日,Mercor 推出 APEX-Agents 基准测试及开源数据集,评估 AI Agent 在投行、咨询和法律领域的长周期任务表现。该基准含专家构建的 33 个场景世界和 480 项任务。
基于此,Artificial Analysis 上线 APEX-Agents-AA 排行榜,采用 Stirrup 框架运行 452 项任务。根据该机构提供的评测数据,GPT-5.4 以 33.3% 得分位居第一,Claude Opus 4.6 以 33.0% 紧随其后,Gemini 3.1 Pro Preview 得分为 32%。

相关链接:
- https://www.mercor.com/apex/apex-agents-leaderboard/
- https://x.com/ArtificialAnlys/status/2041896261826310598
Mario Zechner 携开源项目 pi 正式加入 Earendil 公司 #13
开源项目 pi 的创始人 Mario Zechner 宣布加入 Earendil 公司,并将该项目带入该公司,核心将永久保持 MIT 开源协议。
未来,该项目计划引入增值功能及专有企业级功能,以实现平衡发展。
开源项目 pi 的创始人 Mario Zechner 宣布加入 Earendil 公司,并将该项目带入该团队。根据其发布的公告,pi 的 GitHub 仓库将从 badlogic/pi-mono 迁移至 earendil-works/pi,包名也更改为 @earendil/pi,而官网 pi.dev 将保留并增加 Earendil 标识。
该项目所有权现归属 Earendil,由 Mario Zechner 与联合创始人 Armin、Colin 共同主导技术决策与路线图。
为平衡开源精神与商业化,pi 的核心将永久保持 MIT 协议,未来计划在此基础之上引入采用 Fair Source 协议的增值功能以及专有的企业级功能。

相关链接:
阿里组织架构调整,通义实验室升级为事业部 #14
据报道,阿里发布全员信宣布通义实验室升级为事业部,由周靖人负责;同时成立由吴泳铭领衔的集团技术委员会,以统筹技术与AI基础设施建设。
据报道,阿里近期发布了全员信,宣布多项重大组织架构与人事调整。
该集团的通义实验室正式升级为事业部,由周靖人负责。
同时,李飞飞将出任阿里云CTO,负责阿里云技术以及 AI 云基础设施建设。
在机构设置方面,阿里宣布成立阿里巴巴集团技术委员会,由吴泳铭出任组长,成员包括周靖人、吴泽明与李飞飞。
其中,周靖人将担任该委员会的首席 AI 架构师,吴泽明则担任召集人。
相关链接:
Elon Musk 透露七款 Grok 新模型,最高 10T 参数 #15
Elon Musk 透露,SpaceX 的 AI Colossus 2 正在训练从 1T 到 10T 参数规模的 7 个新模型。当前的
Grok 4.20模型参数规模为 0.5T,全新 1T 参数模型预计 2 至 3 周后面世,1.5T 参数模型需 4 至 5 周发布。
Elon Musk 透露了旗下 xAI 新 Grok 模型的最新训练进展与发布时间表。根据其公布的信息,SpaceXAI Colossus 2 目前共有 7 个模型正在训练中,具体包括 Imagine V2、包含 2 个版本的 1T 参数模型、包含 2 个版本的 1.5T 参数模型,以及参数规模高达 6T 和 10T 的模型。
对于新模型的发布节点,Elon Musk 明确表示,1T 参数版本的推出大约还需要 2 到 3 周,而 1.5T 参数版本的发布则需要大约 4 到 5 周。
此外,Elon Musk 回应评论称,当前的 Grok 4.20 模型参数规模约为 0.5T。


相关链接:
HappyHorse-1.0 超越 Seedance 2.0 盲测登顶 #16
HappyHorse-1.0 在 Artificial Analysis 盲测中超越 Seedance 2.0 登顶。
目前官方入口尚未开放,但已出现大量第三方虚假套壳网站。
近日,匿名模型 HappyHorse-1.0 在 Artificial Analysis 盲测平台文生与图生视频(无音频)赛道登顶,超越 Seedance 2.0。
关于其归属,多方传闻指向阿里淘天集团未来生活实验室,由前快手可灵负责人张迪带队,但截至目前尚无官方认领。
该模型暂无官方 API 或体验入口,网上已出现第三方假冒套壳网站。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。