AI 早报 2026-05-22

视频版哔哩哔哩YouTube

概览

要闻

  • DeepSeek 引入 API 并发限制和 user_id 隔离 #1
  • OpenAI 发布 Codex 多项更新,上线 Appshots 与锁屏控制控制功能 #2
  • Qwen3.7-Max 上线 API 和 Qwen Studio #3
  • Antigravity 永久提升 Gemini 模型速率限制并重置周配额 #4

模型发布

  • SpaceXAI 发布编码模型 Grok Build 0.1 #5
  • 腾讯混元开源多语言翻译模型家族 Hy-MT2 #6
  • 网易有道开源多模态数学推理模型 Confucius4 #7
  • 美团开源 LongCat-Video-Avatar-1.5 框架 #8
  • Runway 发布 Aleph 2.0 及 Edit Studio #9

开发生态

  • SpaceXAI宣布OpenCode支持接入Grok订阅 #10
  • Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 #11
  • Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API #12
  • OpenClaw 发布 2026.5.20 版本更新 #13
  • Claude Code 预告升级 /usage 命令支持分类查看 Token 明细 #14

产品应用

  • OpenAI推出ChatGPT for PowerPoint测试版 #15
  • MiniMax Agent 集成 Perplexity Search #16
  • CapCut 宣布与 Gemini App 达成集成合作 #17

行业动态

  • Modal 完成 3.55 亿美元 C 轮融资,投后估值达 46.5 亿美元 #18

前瞻与传闻

  • 消息称月之暗面启动拆除VIE架构 冲刺赴港IPO #19
  • Anthropic被曝正与Microsoft洽谈租用Maia 200芯片 #20

DeepSeek 引入 API 并发限制和 user_id 隔离 #1

DeepSeek更新API文档,明确deepseek-v4-prodeepseek-v4-flash并发上限为5002500,超限报错可免费扩容。新增user_id隔离,实现内容安全与KVCache调度隔离,扩容账号按此独立限速。此外,还增加了请求保活机制。

DeepSeek 官方 API 文档新增限速与隔离细则,规定了不同模型的并发限制与保活机制。

在账号粒度上,deepseek-v4-pro 并发限制为 500deepseek-v4-flash2500。超出限制会返回 HTTP 429 错误码,用户可提交工单免费申请扩容。

API 同时引入了 user_id 隔离功能,用于实现不同终端用户的内容安全、KVCache 及调度隔离。且对扩容账号会按 user_id 维度进行独立并发限速。

此外,请求在等待期间会通过特定格式保活,若 10 分钟 仍未开始推理服务器将关闭连接。

相关链接:


OpenAI 发布 Codex 多项更新,上线 Appshots 与锁屏控制控制功能 #2

OpenAI发布Codex应用多项更新。Appshots功能支持一键截取窗口画面与文本。/goal指令正式上线。Computer Use新增锁定模式,允许用手机远程操控已锁屏的MacBusiness版新增支持共享自定义插件。

OpenAI 集中发布了针对编程工具 Codex 应用的多项功能更新。

官方正式推出 Appshots 功能,允许用户在 Mac 上通过双击 Command 键一键提取当前应用窗口的截图及完整文本上下文。

同时 /goal 指令结束实验阶段,支持 Codex 持续数小时甚至数天处理长任务,目前部分用户可能需手动运行命令来激活该功能。

此外,Computer Use 新增锁定使用能力,允许用户通过手机等设备远程操控已锁屏的 Mac 主机,Business 版用户也已获准在团队内共享自定义插件。

相关链接:


Qwen3.7-Max 上线 API 和 Qwen Studio #3

Qwen3.7-Max 正式上线 APIQwen Studio。该模型标准输入和输出价格分别为每百万 tokens 12 元36 元。根据 Artificial Analysis 数据,其智能指数得分达 56.6 分,幻觉率显著降低。

阿里云百炼平台现已上线 Qwen3.7-Max 模型,当前开放纯文本输入与输出能力。官方强调其在长周期自主执行、编程及办公生产力等 Agent 能力上有所提升。

在定价与规格方面,该模型上下文窗口为 1M tokens;其标准输入和输出价格分别为每百万 tokens 12 元和 36 元。据 Artificial Analysis 测试数据,Qwen3.7-Max智能指数 中得分 56.6,较 Qwen3.6-Max-Preview 提升 4.8 分。

相关链接:


Antigravity 永久提升 Gemini 模型速率限制并重置周配额 #4

Google宣布,Antigravity 已将所有付费层级中 Gemini 模型的速率限制永久提升 3 倍,并重置了所有用户本周的 Gemini 配额,以回应用户快速触及限制的反馈。

Google 宣布,Antigravity 已将所有付费层级中 Gemini 模型 的速率限制永久提升 3 倍,并重置了所有用户本周的配额。

官方表示此举旨在回应用户过快达到限制的反馈,以便用户进一步测试 3.5 Flash 模型

针对 Antigravity 2.0 更新导致 IDE 消失、丢失配置的问题,工作人员承认发布不够顺利,将发布更新进行修复。


SpaceXAI 发布编码模型 Grok Build 0.1 #5

SpaceXAI 近期上线了专为 agentic coding 打造的 Grok Build 0.1 模型,现已上线官方及部分第三方 API 平台。

SpaceXAI 发布了专为 agentic software engineering workflows 训练的快速模型 Grok Build 0.1

该模型目前处于早期访问和 Beta 测试阶段。新模型支持 256K 上下文窗口、函数调用 及推理功能。

且推理算力不可配置、不支持非推理模式,官方 API 输入和输出定价分别为每百万 token 1 美元2 美元

除官方 API 外,该模型现已集成至 Grok Build CLI,并登陆 Vercel AI GatewayNous ResearchHermes Agent 等第三方平台。

相关链接:


腾讯混元开源多语言翻译模型家族 Hy-MT2 #6

腾讯混元正式开源多语言翻译模型系列 Hy-MT2,并上线“腾讯 Hy 翻译”小程序。官方称该系列包含 三款 支持 33 种 语言的模型,性能在多项任务中击败多家头部闭源模型。

腾讯混元发布了全新多语言翻译模型 Hy-MT2,并已同步推出支持离线端侧推理的“腾讯 Hy 翻译”小程序。

该系列涵盖 1.8B7B30B-A3B 三种参数规模,均支持 33 种语言互译与 5 种中国方言。

官方表示,7B30B-A3B 模型在各类任务中达到开源最佳,在真实场景评测中甚至超越了 DeepSeek-V4-ProGemini 3.1 Pro 等头部闭源模型。

1.8B 模型也击败了微软等主流商业翻译 API。得益于自研的 1.25-bit 极端量化技术,1.8B 模型仅需约 440MB 存储空间即可在主流手机芯片上部署。

且推理速度较上代提升 1.5 倍。目前模型与配套的翻译指令遵循测试集已在 Github 等多个平台开源,iOS 和安卓独立 APP 正在上架中。

相关链接:


网易有道开源多模态数学推理模型 Confucius4 #7

网易有道开源多模态数学推理模型“子曰4”。该模型基于 Qwen3.5-27B,官方称其在 视觉数理基准测试 中达到同规模 SOTA 水平,并将 思维链 长度减少约 43.2%

网易有道 AI 团队已正式开源专为数学推理设计的 多模态大模型子曰4”,该项目基于 Qwen3.5-27B 进行二次开发并遵循 Apache 2.0 协议。

该模型采用“监督微调(SFT)+强化学习(RL)”的迭代训练框架,官方数据显示其在多个视觉数理基准上达到同尺寸模型的最佳水平,并在内部闭源数据集 Math-Hard-500 上实现了 23.2% 的性能提升。

为解决推理过度思考的问题,团队通过引入 长度感知强化学习 等机制,使整体思维链减少了 43.2%,从而降低了解题成本与响应时间。

相关链接:


美团开源 LongCat-Video-Avatar-1.5 框架 #8

美团 LongCat 团队开源了音频驱动数字人视频生成框架 LongCat-Video-Avatar-1.5。新版本将音频编码器升级为 Whisper-large-v3,并通过步数蒸馏技术将推理加速至 8 步。

美团 LongCat 团队正式发布了 LongCat-Video-Avatar-1.5 框架及对应权重。

该版本采用 Whisper-large-v3 替代原有的 Wav2Vec2 音频编码器,以提升唇形同步的准确度与自然度。原生支持音频文本到视频、音频图像到视频及视频续写任务,并能够泛化至动漫、动物及多人交互等复杂场景。

官方通过基于 508 对测试数据和 770 名评估者的人类评估基准宣称,该模型在写实度、稳定性和自然度上表现优异。

模型默认强制开启基于 DMD28 步蒸馏推理,并提供 INT8 量化选项以降低显存占用。虽然模型权重遵循 MIT 协议开源,但官方明确要求其生成的演示内容仅限学术使用,不得用于商业用途。

相关链接:


Runway 发布 Aleph 2.0 及 Edit Studio #9

Runway 官方发布旗舰视频编辑模型升级版 Aleph 2.0 及新产品 Edit Studio。该模型支持最长 30 秒 1080p 视频处理,具备局部精准修改及跨镜头编辑等能力,目前已在桌面网页端向所有付费用户开放。

Runway 官方宣布推出其旗舰视频编辑模型的升级版 Aleph 2.0,并同步上线专为该模型打造的新产品体验 Edit Studio

Aleph 2.0 现已支持处理时长上限为 30 秒1080p 视频素材,并在编辑过程中能精准保留原视频未修改的细节,避免多余的画面变动。

同时,新模型引入了图像级别的控制能力,用户可通过修改单帧画面来指导视频的最终呈现效果,且支持在包含多次场景切换的视频中跨多个镜头一次性应用编辑。

Edit Studio 允许用户在正式生成前将修改效果作为图像进行预览,从而减少试错成本并加快迭代速度。

目前,上述功能已面向所有 Runway 付费计划的用户开放,可通过桌面网页端使用。

相关链接:


SpaceXAI宣布OpenCode支持接入Grok订阅 #10

SpaceXAI 宣布用户现已能在 OpenCode 中使用 SuperGrokX Premium 订阅。接入后可直接使用 Grok Build 模型进行编码。

SpaceXAI 宣布用户现已能在 OpenCode 中使用其 SuperGrokX Premium 订阅。

接入后,用户可使用驱动 Grok Build 的底层模型进行编码,该模型与 SpaceXAI 基于终端的 Agent 采用同一模型,旨在提供高速度和代码库智能支持。

用户只需在 OpenCode 中执行 /connect 命令并选择“xAI”,即可根据设备环境选择通过浏览器或无头模式完成身份验证。

SpaceXAI 同时预告,未来将推出更多开源 Agent 和集成功能。

相关链接:


Google 发布 ADK for Kotlin 与ADK for Android 0.1.0 版本 #11

Google 官方宣布推出 ADK for KotlinADK for Android0.1.0 版本,开发者可利用该开源框架在后端或 Android 应用内构建 AI Agent

Google 官方宣布推出用于开发和运行 AI Agent 的开源框架 ADK for KotlinADK for Android0.1.0 版本。

其中,ADK for Kotlin 面向后端项目,而 ADK for Android 提供专门的端侧优化。

允许开发者利用本地大语言模型在设备上直接运行 Agent,在保护隐私的同时保持与云端模型交互的灵活性。

此次发布的首个实验性版本包含了完整的构建基础。

支持混合编排、MCP ToolsA2A 以及多种 Agent 类型与运行时管理功能。

相关链接:


Anthropic 公布 Claude Opus 网络安全应用成果并发布 Compliance API #12

Anthropic 发布了多家安全厂商将 Claude Opus 模型应用于网络安全防御的早期测试数据,并面向 Claude Enterprise 正式推出 Claude Compliance API

Anthropic 官方公布了 WizPalo Alto NetworksAccenture 等合作伙伴利用 Claude Opus 进行漏洞挖掘与修复的早期成果。

根据官方提供的数据,Accenture 内部的安全测试覆盖率已从约 10% 提升至 80% 以上,扫描周转时间从 35 天缩短至不到 1 小时。

同时,Anthropic 发布了 Claude Compliance API,提供对 Claude Enterprise 对话内容及平台活动日志的编程访问接口。

目前,包含 CrowdStrikeMicrosoft Purview 在内的 28 款外部安全与合规工具已完成集成并向企业客户开放。

相关链接:


OpenClaw 发布 2026.5.20 版本更新 #13

OpenClaw 官方发布 2026.5.20 版本更新,该版本新增了 Discord 语音跨频道跟随用户、敏感明文密钥警告提示,并修复了 Windows 安装界面冻结及无头设备 SpaceXAI 登录验证等问题。

OpenClaw 官方正式发布 2026.5.20 版本更新,本次主要聚焦于底层体验与安全性的修复。

更新后,Discord 语音会话支持自动跟随配置用户跨频道移动并进行多人切换,Doctor 工具会在配置文件包含明文密钥时发出警告,且模型固定状态提示变得更加清晰。

此外,此次更新解决了 Windows 环境安装时卡顿的问题,并引入了设备代码 OAuth 来简化无头设备上的 SpaceXAI 登录验证。

相关链接:


Claude Code 预告升级 /usage 命令支持分类查看 Token 明细 #14

Anthropic 预告 Claude Code 下一版本将升级 /usage 命令,支持按 SkillsAgentsMCPsPlugins 分类查看 Token 消耗明细,同时将登陆 Desktop 端。

Anthropic 工程师 Boris Cherny 预告 Claude Code 下一版本将升级 /usage 命令,支持按 SkillsAgentsMCPsPlugins 分类展示 Token 消耗明细,并已新增 MCP 支持。

该功能聚合所有会话数据,可按天或按周筛选,统计方式会将下游 tokens 归因到对应的 skillpluginMCP。目前该功能已在 CLI 端可用,即将上线 Desktop 端,数据暂未通过 API 向第三方工具开放。

同期,Claude Code v2.1.147 已发布,引入默认关闭的 Workflow 工具用于确定性多智能体编排,并将 /simplify 命令重命名为 /code-review

相关链接:


OpenAI推出ChatGPT for PowerPoint测试版 #15

OpenAI推出ChatGPT for PowerPoint测试版插件,支持在PPT内直接创建、编辑幻灯片及生成图像,现已面向全球多数用户开放。

OpenAI官方宣布推出“ChatGPT for PowerPoint”加载项测试版,用户可直接在 PowerPoint 中调用 ChatGPT 创建、编辑演示文稿及生成图像。

该工具不仅能基于文档或提示词生成新幻灯片,还能分析现有内容结构、提取关键信息并保持幻灯片可编辑状态。

目前该功能已面向全球的 ChatGPT FreePlusProBusinessEnterpriseEdu 等各级别用户开放,用户需通过 Office 加载项商店安装并登录 OpenAI 账号使用。

相关链接:


MiniMax Agent 集成 Perplexity Search #16

MiniMax Agent 官方宣布已集成并上线 Perplexity AI Search。官方数据显示,该搜索方案较原默认服务总成本降低 27%,且通过率提升 2%

MiniMax Agent 现已集成并上线 Perplexity AI Search

官方称在 700 多个 Agent 任务的基准测试中,Perplexity 提供了最佳的答案质量与片段密度。

与之前的默认服务 Serper 相比,新集成使总成本降低 27%,工具调用次数减少 45%Token 使用量下降 42%,且通过率提升 2%

官方指出,高质量的搜索片段能提供更好的基础,从而有效减少 Agent 工作流中的循环搜索次数。

相关链接:


CapCut 宣布与 Gemini App 达成集成合作 #17

剪映国际版 CapCut 官方宣布正与 Gemini App 建立合作,用户不久后将能在 Gemini 应用内直接使用 CapCut 的高级功能编辑图片和视频。

剪映国际版 CapCut 官方发文确认与 Gemini App 达成合作。

集成完成后,用户不久后将能够直接在 Gemini 应用内调用 CapCut 的高级创作与编辑能力来处理图片和视频。

CapCut 表示,随着工作流变得更加无缝,未来的创作将更具对话性、直观性且实现跨工具智能整合。

相关链接:


云平台 Modal 宣布完成 3.55 亿美元 C 轮融资,投后估值达 46.5 亿美元。官方称其年化收入已超 3 亿美元,未来将重点扩展 大规模低延迟推理Agent 计算层

官方宣布,为 AI 工作负载构建云平台的 Modal 完成 3.55 亿美元 C 轮融资,投后估值达 46.5 亿美元

本轮融资由 General CatalystRedpoint 领投。

官方称,自去年九月以来其业务增长五倍,年化收入已超过 3 亿美元。且平台已累计启动超 10 亿个 用于运行 AI 代码的隔离环境。

该公司计划利用新资金推进大规模低延迟推理、强化学习循环整合以及构建 Agent 计算层。并将通过推出细粒度 RBAC 来安全赋能 Agent 开发。

相关链接:


消息称月之暗面启动拆除VIE架构 冲刺赴港IPO #19

据报道,月之暗面完成20亿美元新一轮融资后,已正式通知股东启动拆除 VIE红筹架构,旨在为赴港 IPO 扫清障碍,其投后估值已突破200亿美元

据媒体报道,月之暗面在完成20亿美元新融资后,已正式向股东发出通知启动架构重组。核心动作是拆除现有的VIE红筹架构,以期为赴香港证券交易所IPO 扫清监管障碍。

据知情人士透露,该公司计划解散相关离岸实体并建立合资企业结构,从而在合规的同时保留外资投资者权益。

在资本层面,月之暗面过去6个月累计融资约39亿美元,投后估值突破200亿美元。而在业务端其年度经常性收入也已突破2亿美元


Anthropic被曝正与Microsoft洽谈租用Maia 200芯片 #20

据报道,Anthropic正在与Microsoft进行早期洽谈,拟租用Microsoft尚未向外部客户开放的定制AI芯片``Maia 200,但双方目前尚未签署最终协议。

The Information 等媒体报道,Anthropic 正与 Microsoft 进行早期洽谈。

拟在 Azure 上部署 Microsoft 的自研 AI 芯片 Maia 200。该芯片旨在高效运行如 Claude 等已有模型。

Microsoft 至今未将其开放给 Azure 客户,仅用于自有数据中心。

若最终敲定租用,这将是 Microsoft 自研芯片在外部云客户中的一次重要突破。

目前谈判仍处早期阶段,知情人士称尚未达成任何承诺。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误