2026-04-17

AI 早报 2026-04-17
概览
要闻
模型发布
- OpenAI 发布 GPT-Rosalind 生命科学专用推理模型 ↗
#4 - 阿里推出开放式世界模型 Happy Oyster 启动早期体验 ↗
#5 - 腾讯发布并开源混元世界模型 HY-World 2.0 ↗
#6 - 阶跃星辰正式发布 StepAudio 2.5 TTS 语音生成模型 ↗
#7 - Google DeepMind 发布 TIPSv2 模型,入选 CVPR 2026 且开源 ↗
#8
开发生态
产品应用
- Adobe 推出 Firefly AI 助手,集成 30 款模型及跨应用编排 ↗
#11 - MiniMax 推出云端沙箱智能体 MaxHermes ↗
#12 - AI Mode in Chrome 上线侧边浏览及跨页搜索功能 ↗
#13 - 谷歌 Gemini 推出限时优惠,升级 AI Pro 享 YouTube Premium 一年半价 ↗
#14
技术与洞察
- Claude Code 工程师发文分享上下文管理策略 ↗
#15
行业动态
前瞻与传闻
- xAI 宣布 Grok Build 应用下周上线 Beta 版 ↗
#18 - 传 xAI 拟向 Cursor 提供算力 训练 Composer 2.5 ↗
#19 - Anthropic 拟向美政府和英金融界开放 Claude Mythos ↗
#20
Anthropic 发布 Claude Opus 4.7 模型 #1
Anthropic 发布了 Claude Opus 4.7 模型。新模型较前代大幅提升了高级软件工程与复杂长流程任务的自主执行能力,图像输入分辨率提升逾三倍,并引入了自适应思考机制。
同时,该模型在训练期间被刻意弱化了网络安全能力。
此次更新还同步引入了全新
tokenizer、介于high与max之间的xhigh推理力度等级,并在 API 侧开启了任务预算功能的公测。API 定价与前代持平。为应对新模型增加的 token 消耗,Anthropic 已永久上调所有付费订阅用户的额度作为补偿。
Anthropic 正式发布其最新旗舰模型 Claude Opus 4.7。该模型在高级软件工程能力上较前代 Opus 4.6 实现显著提升,尤其在处理最困难的编程任务时表现出更强的自主性与严谨性,能够独立完成此前需要人工密切监督的复杂长流程任务,并在反馈前自行验证输出结果。
性能方面,Opus 4.7 在 SWE-Bench Verified 达到 87.6%、SWE-Bench Pro 64.3%、TerminalBench 69.4%,并在第三方 Finance Agent 评估及 GDPval-AA 中取得 state-of-the-art 成绩,但其整体能力仍弱于 Anthropic 内部更强大的 Claude Mythos Preview,后者因网络安全风险考量暂未广泛开放。
视觉方面,Opus 4.7 支持最高 2,576 像素长边(约 375 万像素)的图像输入,超过此前 Claude 模型的三倍。
安全层面,在该模型训练期间 Anthropic 刻意压低了其网络攻击能力,并配套了自动检测和拦截高风险网络安全请求的安全机制。
Opus 4.7 现已上线 Claude 全系产品及 API,同步登陆 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry,API 调用名称为 claude-opus-4-7,定价与 Opus 4.6 保持一致(每百万 token 输入 5 美元、输出 25 美元),上下文窗口维持 100 万 token 不变。
此次更新同步引入了全新 tokenizer、介于 high 与 max 之间的 xhigh 推理力度等级、API 侧公测形式的任务预算功能。因 token 消耗增加,Anthropic 已为所有付费订阅用户永久上调速率限制以作补偿。



相关链接:
- https://www.anthropic.com/news/claude-opus-4-7
- https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7
OpenAI 发布 Codex 桌面端重大升级 #2
OpenAI 发布 Codex 桌面端重大更新。该应用现支持在 macOS 后台通过专属虚拟光标并行操作无API软件。
新增支持精准批注的内置浏览器、图像生成功能,以及90多款集成插件。
同时推出了能保留长期上下文、实现自我排程唤醒的自动化线程与经验记忆系统。
目前各项更新已面向桌面端 ChatGPT 用户逐步推送。
OpenAI 近日为桌面端应用 Codex 推出了重大版本更新,将这款工具从传统的代码助手,全面升级为能够跨越整个软件开发生命周期的智能工作空间。
根据官方公告,该应用程序现已支持后台 Computer Use 功能,允许 Agent 在 macOS 上通过专属虚拟光标在后台并行操作各类应用,打破了没有 API 的软件交互限制。
同时,Codex 集成了支持精准批注指引的内置浏览器、基于 gpt-image-1.5 模型的图像生成与编辑功能,以及 90 多个涵盖 MCP 服务器和各类开发工具的新插件。
此外,Codex 引入了能够保留长期上下文并实现自我排程唤醒的“Heartbeats”自动化线程,以及能够记住用户偏好和历史操作的经验记忆系统。
目前,上述更新已面向使用 ChatGPT 账号登录的桌面端用户逐步推送,Computer Use 功能率先登陆 macOS 平台,而部分个性化功能将稍后向企业版、教育版以及欧盟和英国地区用户开放。

相关链接:
Qwen 开源 Qwen3.6-35B-A3B 模型 #3
Qwen团队发布并开源了
Qwen3.6-35B-A3B模型。该模型主打稳定性和真实场景实用性,重点强化了智能体编程、前端工作流及多模态感知能力。官方评测显示,它在多项编程、视觉语言及空间智能基准测试中表现出色。
阿里 Qwen 团队发布并开源了 Qwen3.6-35B-A3B,这是 Qwen3.6 的首个 open-weight 版本,也是一款原生多模态的稀疏 MoE 模型,总参数量为 35B、激活参数为 3B。
该模型支持思考与非思考两种模式,现已可在 Qwen Studio 直接体验,开源权重已上线 Hugging Face 与 ModelScope,并支持本地部署。
官方将该模型定位为面向稳定性与真实世界实用性的高效模型,强调其在 Agentic Coding、前端工作流、仓库级推理、多模态感知与推理方面的提升,并新增 preserve_thinking 选项,用于在历史消息中保留 reasoning context,推荐用于智能体任务。
根据官方给出的基准数据,该模型在多项编程、Agent、知识、STEM、视觉语言、空间智能和视频理解任务上,相比前代 Qwen3.5-35B-A3B 有明显提升,并在不少项目上接近或超过更大规模的稠密模型。


相关链接:
- https://qwen.ai/blog?id=qwen3.6-35b-a3b
- https://huggingface.co/Qwen/Qwen3.6-35B-A3B
- https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B
- https://chat.qwen.ai/
OpenAI 发布 GPT-Rosalind 生命科学专用推理模型 #4
OpenAI 发布了专为生命科学打造的推理模型 GPT-Rosalind,旨在通过对化学、基因和蛋白质的深刻理解来加速新药研发与转化医学进程。该模型在多项生物基准测试中击败了
GPT-5.4及绝大多数人类专家。
OpenAI 正式发布了专为生命科学领域打造的前沿推理模型 GPT-Rosalind。该模型针对现代科学工作流进行了深度优化,融合了更强的工具调用能力与对化学、蛋白质工程及基因组学的深刻理解。
根据官方提供的数据,GPT-Rosalind 在生物信息学基准测试 BixBench 上取得了有公布分数模型中的领先性能,在 LABBench2 的 11 项任务中有 6 项超越了 GPT-5.4,并在与 Dyno Therapeutics 合作的 RNA 序列预测任务中,其 10 次提交取最优的表现超越了 95% 的领域人类专家。
目前,该模型已作为 Research preview(研究预览)通过受信任访问计划在 ChatGPT、Codex 和 API 中面向符合条件的美国合格企业客户开放。
同步推出的还有免费且开放的 Codex Life Sciences research plugin,支持接入超 50 个公共多组学数据库与生物学工具。预览期间该模型的使用不会消耗现有额度或 Token。
OpenAI 正与 Amgen、Moderna 等机构展开合作,致力于通过该系统帮助研究人员从海量数据中得出更具防御性的生物学结论,从而缩短新药研发所需的漫长周期。

相关链接:
- https://openai.com/index/introducing-gpt-rosalind/
- https://github.com/openai/plugins/tree/main/plugins/life-science-research
- https://openai.com/form/life-sciences-access/
阿里推出开放式世界模型 Happy Oyster 启动早期体验 #5
阿里巴巴AI创新事业部正式推出开放式世界模型产品 Happy Oyster,并同步启动早期体验申请。该产品基于原生多模态架构,支持
多模态输入与音视频联合生成。
阿里巴巴ATH事业群旗下AI创新事业部正式推出开放式世界模型产品 Happy Oyster,并同步启动早期体验(内测)申请。
该产品基于原生多模态架构,支持多模态输入与音视频联合生成。与传统“一次性生成”的AI视频工具不同,其在生成全过程中能持续听取并响应指令,实现实时且不断演化的流式世界建模。
该产品提供 Directing(导演模式)和 Wandering(漫游者模式)两种核心玩法。
根据官方规格数据,Directing 模式支持最长3分钟、480p或720p分辨率,可通过实时文本指令交互;Wandering 模式支持最长1分钟、480p分辨率,交互方式为 WASD 键与镜头控制。
目前,用户可通过其官网点击“Explore Now”或“Join the waitlist”加入候补名单。

相关链接:
腾讯发布并开源混元世界模型 HY-World 2.0 #6
腾讯混元发布并开源了多模态世界模型
HY-World 2.0。该模型能通过文本、图像或视频等多模态输入,直接生成可实时探索且具备物理碰撞效果的完整3D世界,还可直接输出真正可编辑的持久化3D资产。
腾讯混元团队日前正式发布并开源了多模态世界模型 HY-World 2.0。该模型支持通过文本、图像和视频等多模态输入,自动生成、重建并模拟可交互的完整 3D 世界。
与以往仅生成像素级视频的模型不同,HY-World 2.0 直接输出 Mesh、3DGS 和点云等真正可编辑且持久化的 3D 资产,能够无缝导入 Unity、Unreal Engine 等主流游戏引擎进行二次开发。
其不仅原生具备 3D 一致性,还内置了支持物理碰撞和物理感知移动的交互式角色探索模式。
目前,官方已在 GitHub 和 Hugging Face 等平台开源了技术报告、WorldMirror 2.0 的推理代码与模型权重,其余核心模块代码及权重也即将陆续释出。

相关链接:
阶跃星辰正式发布 StepAudio 2.5 TTS 语音生成模型 #7
阶跃星辰发布了语音生成模型
StepAudio 2.5 TTS,该模型支持用户通过自然语言精准控制整段语音的情绪基调与潜台词等细节,并能实现零样本音色复刻。目前,该模型已上线阶跃星辰开放平台和Step Plan。
阶跃正式发布新一代语音生成模型 StepAudio 2.5 TTS,该模型现已全量上线。
根据官方说法,此次发布的 StepAudio 2.5 TTS 围绕全局语境控制、文中语境控制以及零样本复刻与全音色控制三项核心能力进行构建。
该模型摒弃了传统的标签或短语组合控制方式,转而支持用户直接通过自然语言描述来设定整段语音的情绪基调,并精准调节句中的语气、停顿、角色心理活动及潜台词等细节。
同时,其具备的零样本复刻功能允许任意用户音色无需重新训练即可进行高品质生成,并能构建完整的“声音角色档案”。
目前,开发者和创作者可通过阶跃星辰开放平台、Step Plan、体验中心以及官方 Demo Page 体验并接入该模型。

相关链接:
Google DeepMind 发布 TIPSv2 模型,入选 CVPR 2026 且开源 #8
Google DeepMind 推出了全新的基础图像文本编码器模型 TIPSv2,该模型通过引入全新的扩展监督机制和减少训练参数等三大核心技术升级,在零样本分割等多项任务中击败了主流大模型。
Google DeepMind 团队推出了 TIPSv2,这是一系列具备增强密集块级文本对齐能力的基础图像-文本编码器模型。
该模型的研发起源于一项惊人发现:在标准预训练中,经过蒸馏处理的较小规模学生模型在块级文本对齐能力上显著超越了其庞大的教师模型。
基于此,研究人员对预训练方案进行了三大核心升级:提出将掩码图像建模损失扩展至所有 token 的 iBOT++、旨在减少 42% 训练参数的 Head-only EMA,以及利用 PaliGemma 和 Gemini 生成多粒度标题的监督策略。
综合这些改进,TIPSv2 在涵盖 9 个任务和 20 个数据集的广泛评估中展现出卓越性能,特别是在零样本分割任务中取得显著增益,整体表现达到或超越了近期的视觉编码器模型。
该项目已入选将在后续举办的计算机视觉顶级会议 CVPR 2026,其代码、模型及交互式演示已在 GitHub 和 HuggingFace 平台公开发布,并采用 Apache 2.0 开源许可。

相关链接:
- https://gdm-tipsv2.github.io/
- https://github.com/google-deepmind/tips
- https://huggingface.co/google/tipsv2-l14
Claude Code 新增 ultrareview 命令,桌面端开放蓝牙 API #9
Claude Code 迎来多项更新,新增
ultrareview命令能自动捕捉代码审查中的潜在问题,同时auto mode已向 Max 用户提供。Claude 桌面应用新增了
Bluetooth API,能构建与 Claude 交互的硬件设备。此外,Anthropic 重置了订阅用户的速率限制。
Claude Code 迎来多项功能更新,其中新增的 /ultrareview 命令可运行专门会话以标记代码审查中的潜在问题,同时自动模式已扩展至 Max 用户,从而减少长时任务的中断。
为了简化工作流迁移,官方更新了该工具内的 claude-api 技能以支持 Opus 4.7,用户只需输入特定指令即可自动更新相关模型配置。
此外,Claude Cowork 和 Code 桌面应用引入了面向创客与开发者的 Bluetooth API,允许构建可与 Claude 交互的硬件设备,该 API 仅在开启开发者模式时启用,相关参考代码已在 GitHub 公开。
因为出现速率限制错误,Anthropic 还重置了订阅用户的速率限制。



相关链接:
- https://x.com/ClaudeDevs/status/2044872737672646716
- https://github.com/anthropics/cla
- https://x.com/felixrieseberg/status/2044920611215233397
TRAE 发布 v3.3.51 支持自定义模型 baseURL 配置 #10
TRAE 最新版本新增自定义模型
baseURL配置功能。用户添加模型时需输入模型 ID 及完整的网络地址。
近日,TRAE 正式发布了 v3.3.51 版本,该版本的新增功能允许用户在添加或编辑自定义模型时配置自定义 baseURL。
在具体的配置操作中,用户需选择使用其他模型并输入相应的模型 ID,且必须填写完整的 URL 地址。

相关链接:
Adobe 推出 Firefly AI 助手,集成 30 款模型及跨应用编排 #11
Adobe 正式推出了 Firefly AI 助手。用户只需用自然语言描述需求,该助手就能在
Photoshop等多款应用中自动编排并执行复杂工作流,实现像素级的精细编辑。
Adobe 近日正式推出了由其 creative agent 驱动的 Firefly AI Assistant。这款即将在 Adobe Firefly 平台开启公开测试的工具,致力于通过单一的对话式界面,整合 Adobe Creative Cloud 旗下应用的核心能力。
用户只需用自然语言描述期望的最终结果,该助手便能在 Photoshop、Premiere、Lightroom、Express 和 Illustrator 等多个应用中自动编排并执行复杂的多步工作流。
作为 Project Moonlight 项目的演进,Firefly AI Assistant 允许用户在保持完全控制权的前提下,通过原生的 Adobe 文件格式实现像素级的精细编辑。

相关链接:
MiniMax 推出云端沙箱智能体 MaxHermes #12
MiniMax 上线了基于
Hermes Agent的云端沙箱智能体 MaxHermes,官方称其为能自主提炼并迭代技能的自我进化AI助手,并支持用Token Plan抵扣任务消耗。
MiniMax 官方上线宣称的全球首个云端沙箱 Hermes Agent 产品 MaxHermes。该助手具备学习闭环机制,完成任务自动提炼可复用 Skills 保存并按需加载,随反馈改进。其 Skills 由 Agent 自主生成迭代,而非人工预设。
该智能体支持持久化跨会话记忆、自然语言定时任务及多子代理并行运行。产品无需自备服务器及 API Key,打通主流 IM 渠道实现 7×24 小时响应,支持 Token Plan 抵扣。
后续将连通 Skillhub 并支持 MaxClaw 配置迁移。现可通过网页链接体验。

相关链接:
AI Mode in Chrome 上线侧边浏览及跨页搜索功能 #13
Google 为 AI Mode in Chrome 功能推出全新搜索体验升级,现在支持目标网页与 AI 对话界面的并排浏览,还支持将近期打开的网页、图片或 PDF 混合作为上下文带入
AI 搜索。
谷歌近日针对 Chrome 浏览器中的 AI Mode 推出全新 Search 体验升级,旨在解决传统的“标签页跳跃”问题。该新体验允许桌面端用户在点击搜索结果链接时,将网页与 AI Mode 对话界面以侧边并排形式打开,从而在不丢失上下文的情况下进行参考、对比与追问。
此外,其团队还引入了跨标签页搜索功能,支持桌面端与移动端用户将最近访问的标签页、图片或 PDF 文件混合搭配作为上下文带入 AI Mode,并在同一入口直接调用 Canvas 及图片创建等高级工具。
目前,上述所有更新已在美国地区正式上线,并即将扩展至全球更多地区。

相关链接:
谷歌 Gemini 推出限时优惠,升级 AI Pro 享 YouTube Premium 一年半价 #14
Google 针对美国等六国用户推出限时优惠,本月 29 日前升级至 AI Pro 计划,即可享受为期一年的 YouTube Premium 半价折扣以及更高级别的
Gemini功能访问权,优惠期结束后将转为低费率捆绑自动续订。
Google Gemini 推出了一项限时订阅优惠。用户在升级至 Google AI Pro 计划后,即可获得为期一年的 YouTube Premium 半价折扣,并捆绑提供更高级别的 Gemini 功能访问权限。
这项限时活动目前仅面向美国、巴西、加拿大、德国、法国和日本的用户开放,将于本月29日结束。用户可通过 Google One 应用或相关官方网站参与该活动。
在12个月的优惠期结束后,上述 YouTube Premium 服务将通过与 Google One 捆绑购买的方式,以较低的费率自动续订。

相关链接:
Claude Code 工程师发文分享上下文管理策略 #15
Claude Code 工程师发文分享上下文管理策略:优先使用
/rewind回退纠错,利用/compact和/clear精简冗长对话,指派 Subagents 在独立环境中处理仅需最终结论的繁杂任务,并在开启全新任务时果断新建会话。
近日,Claude Code 团队工程师 Thariq Shihipar 发布长文,系统阐述了该产品在升级至 100 万 token 上下文窗口后的会话管理策略。该工程师指出,庞大的上下文窗口是一把双刃剑,虽然它让 Claude Code 能够更长时间地自主运行并更可靠地处理复杂任务,但也极易引发“上下文腐烂”问题。
为了应对这一挑战,他建议开发者在每次 Claude 结束一轮操作后,充分利用 Continue、rewind、clear、Compact 以及 Subagents 这五种分支选项,其中 /rewind 被认为是相较于直接纠错更应优先养成的操作习惯。
此外,通过合理利用 Subagents 处理仅需结论而产生大量中间输出的任务,并在开启全新任务或处理相关连续任务时灵活选择不同的会话策略,用户将能够有效规避上述性能下降问题并大幅提升该工具的工作效率。

相关链接:
微软 Fairwater 数据中心提前启用,集成数十万 GB200 芯片 #16
微软宣布威斯康星州 Fairwater 数据中心提前上线,官方称其为全球最强 AI 数据中心,包含数十万块
GB200芯片组成的单一无缝集群。
微软首席执行官 Satya Nadella 宣布,其位于威斯康星州的 Fairwater 数据中心已提前上线。根据官方公告,该数据中心被定位为目前全球最强大的 AI 数据中心。
在硬件架构与部署上,该设施将数十万块 GB200 汇聚成了一个单一且无缝的集群。

相关链接:
OpenAI 构建网络防御生态,授权安全机构访问 GPT-5.4-Cyber #17
OpenAI宣布加速构建全球网络防御生态,向美英两国相关机构提供
GPT-5.4-Cyber模型以评估其网络能力,同时联合 美国银行、英伟达 等14家巨头企业深化真实场景防御。
OpenAI 正在加速构建更具韧性的全球网络防御生态系统,宣布通过其“Trusted Access for Cyber”计划,向美国人工智能标准与创新中心(CAISI)和英国人工智能安全研究所(UK AISI)提供 GPT-5.4-Cyber 模型的访问权限,以供其对模型的网络能力与安全防护措施进行专项评估。
同时,为弥补部分开发团队缺乏全天候安全响应能力的短板,该公司正通过“Cybersecurity Grant Program”提供价值 1000 万美元 的 API 额度。
在私营领域,已有包括美国银行、贝莱德、纽约梅隆银行、花旗、思科、CrowdStrike、高盛、iVerify、摩根大通、摩根士丹利、英伟达、甲骨文、SpecterOps 和 Zscaler 在内的14家知名企业与机构签署协议支持该生态。

相关链接:
xAI 宣布 Grok Build 应用下周上线 Beta 版 #18
马斯克宣布 xAI 旗下编程工具
Grok Build将于下周发布 Beta 版,同步推出桌面应用与终端命令行版本。
Elon Musk 宣布 xAI 旗下的编程工具 Grok Build 将于下周发布 Beta 版,届时将同步推出应用及终端命令行界面。

相关链接:
传 xAI 拟向 Cursor 提供算力 训练 Composer 2.5 #19
据报道,xAI 计划向 Cursor 提供数以万计的 GPU 算力,支持后者训练最新的 AI 模型。
xAI 近期在内部备忘录中承认,该公司当前的模型
FLOPs利用率仅约为 11%。
据知情人士透露,马斯克旗下 xAI 计划向编程初创公司 Cursor 提供数万块 GPU 算力,用于训练其模型 Composer 2.5。此举标志 xAI 转向云服务提供商,旨在利用闲置算力创收并抵消成本。
官方数据显示,xAI 去年拥有约 20 万块 Nvidia GPU,计划扩展至 100 万块。但据媒体报道,xAI 总裁承认当前模型 FLOPs 利用率仅约 11%,远低于行业正常水平。
相关链接:
Anthropic 拟向美政府和英金融界开放 Claude Mythos #20
据报道,Anthropic 正向美国政府机构和英国金融机构开放其
Claude Mythos模型访问权限。
据媒体报道,Anthropic 正准备将其 Claude Mythos 模型推向大西洋两岸的政府与金融部门。根据彭博社报道,该公司计划在未来一周内向英国金融机构开放该模型,而白宫正准备让美国各政府机构获得该模型的访问权限。
这一系列动作是 Anthropic 逐步扩大其「Project Glasswing」计划覆盖范围的一部分,旨在向特定机构提供该 AI 的早期访问权限。

相关链接:
- https://www.bloomberg.com/news/articles/2026-04-16/anthropic-plans-to-bring-mythos-to-uk-banks-within-the-next-week?taid=69e0adaabd318b0001e84068&utm_campaign=trueanthem&utm_content=business&utm_medium=social&utm_source=twitter&embedded-checkout=true
- https://x.com/Polymarket/status/2044838197394338267
提示:内容由AI辅助创作,可能存在幻觉和错误。