AI 早报 2026-05-27

视频版：哔哩哔哩｜ YouTube

概览

要闻

小米宣布 MiMo-V2.5 系列模型永久降价，优化 Token Plan 计费体系 ↗ #1
Kimi 升级风控误封 Kimi Code 用户，官方致歉并恢复账号 ↗ #2

模型发布

Kwai-Keye 发布 Keye-VL-2.0-30B-A3B 多模态模型 ↗ #3
PrismML 发布 Bonsai Image 4B 开源图像模型 ↗ #4
微软发布文生图模型 MAI-Image-2.5 强化文本渲染能力 ↗ #5
OpenMOSS 团队发布 MOSS-TTS-v1.5 与音效生成模型 MOSS-SoundEffect-v2.0 ↗ #6
NVIDIA开源PiD解码器：统一解码与超分 ↗ #7
腾讯 Hy-MT2 模型更换为 Apache 2.0 协议 ↗ #8

开发生态

Anthropic 发布 Claude Code 安全审查插件 ↗ #9
SpaceXAI 改进缓存并重置 Grok Build 额度 ↗ #10
OpenCode Go 上线 Qwen3.7 Max 模型 ↗ #11
美团发布面向 AI Agent 的跑腿下单助手 Skill ↗ #12

产品应用

支付宝推出全栈AI支付体系及首个Token Pay服务 ↗ #13
秘塔AI搜索上线事实核验功能并扩容视频库 ↗ #14

技术与洞察

Datacurve 发布 DeepSWE 长周期软件工程基准 ↗ #15
蚂蚁集团与新加坡国立大学团队提出KPop训练方法 ↗ #16

行业动态

OpenRouter 宣布完成 1.13 亿美元融资 ↗ #17

前瞻与传闻

MiniMax预热M3模型及MSA稀疏注意力架构 ↗ #18

小米宣布 MiMo-V2.5 系列模型永久降价，优化 Token Plan 计费体系 `#1`

小米宣布 MiMo-V2.5 系列 API 永久降价，且不再使用阶梯计费。官方同步优化了 Token Plan 计费体系，用量提升至原来的 5至8 倍，并重置了所有仍在有效期内的用户额度。

小米大模型团队宣布对 MiMo-V2.5 系列模型 API 进行永久降价，新定价于北京时间 5 月 27 日 0 点 全球同步生效。此次调价最高降幅达 99% ，不再区分输入长度区间。

官方同步优化了 Token Plan 计费体系，用量提升至原来的 5-8 倍 ，并重置了所有仍在有效期内的用户额度，同时旧版 V2 系列模型即将下线。

此外， “百万亿 Token 创造者激励计划” 因 100T Tokens 提前发完而收官。

官方称，其团队基于 SGLang HiCache 完整支持 SWA （Sliding Window Attention），将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储间的数据搬运量降低至优化前的近 1/7 ，并将可缓存 token 数量提升至优化前的近 5 倍 ，显著提升了缓存命中率和推理效率。

同时，通过优化专家并行方案、输入长度分桶策略等，进一步提升了集群输入吞吐能力。后续将发布更加详细的推理优化技术 Blog。

相关链接：

Kimi 升级风控误封 Kimi Code 用户，官方致歉并恢复账号 `#2`

Kimi 发布声明称，近期为打击中转站售卖升级了风控策略，因将 User Agent 作为判定依据，误封了一批使用第三方 Agent 的 Kimi Code 用户。官方对此致歉，称已调整策略，目前受限账号已全部恢复正常。

Kimi Code 近期为应对中转站售卖和数据异常请求升级了 风控防御策略。

由于该策略将 User Agent 作为判定依据之一，导致部分构造为 Kimi CLI 的第三方 Code Agent 正常请求被误伤，多名社区用户反馈在使用第三方工具或测试工作流时遭遇封号。

对此，Kimi 团队代表发文致歉，承认初期策略制定粗糙且缺乏充分的反馈机制。

目前官方已调整 风控策略，相关受限账号的请求已全部恢复，团队正联系相关开发者进行 User Agent 的优化工作。

相关链接：

https://x.com/Young_AGI/status/2059248586559488352

Kwai-Keye 发布 Keye-VL-2.0-30B-A3B 多模态模型 `#3`

快手Kwai-Keye团队开源了300 亿参数的多模态模型Keye-VL-2.0-30B-A3B。官方称其为首个在生产环境落地DSA架构的视觉语言模型，长视频理解能力极佳。

快手 Kwai-Keye 团队发布了 300 亿 参数级别的旗舰多模态基础模型 Keye-VL-2.0-30B-A3B，并在 Hugging Face 与 GitHub 上完全开源。

该模型是首个在生产环境中落地 DSA（DeepSeek Sparse Attention） 的视觉语言模型，能够在保持计算效率的同时，对长达一小时的视频进行精准理解。

并在 256K 超长上下文中实现近乎无损的推理。官方数据显示，在同级别模型中，其长视频理解能力表现最佳，并在多项精细时序感知基准上媲美或超越 Gemini 3 Flash 等顶级闭源模型。

作为 Keye 系列的首个 Agent-Ready 基础模型，它内置了系统级的编排机制，原生支持 Search、Tool 和 Code 场景。

相关链接：

PrismML 发布 Bonsai Image 4B 开源图像模型 `#4`

PrismML 官方发布 Bonsai Image 4B 开源图像模型，包含 1-bit 和 Ternary 两种版本。主打在手机等本地设备运行。

PrismML 官方发布了专为本地设备设计的 Bonsai Image 4B 图像生成模型家族，包含 1-bit 和 Ternary 两种版本。

官方数据显示，基于 FLUX.2 Klein 4B 架构，这两款模型将 Diffusion Transformer 体积最高压缩了 8.3 倍至 0.93GB 和 1.21GB。

同时保留了原模型 88% 至 95% 的基准性能，支持在 iPhone 等设备上本地运行。两款模型已采用 Apache 2.0 协议开源并推出 iOS 应用 Bonsai Studio。

相关链接：

微软发布文生图模型 MAI-Image-2.5 强化文本渲染能力 `#5`

微软宣布推出图像生成模型 MAI-Image-2.5，官方称其已登上 Arena 文生图排行榜第三名，并在文本渲染与视觉推理方面实现重大改进，该模型现已上线 Arena 平台供用户体验。

微软正式发布了其最新的图像生成模型``MAI-Image-2.5。官方表示，该模型目前已在 Arena 文生图排行榜上位居第三。

相比前代 MAI-Image-2，MAI-Image-2.5 在文本渲染、风格化插图和商业图像方面取得了显著进步，能够处理多种风格、准确遵循指令，并在对象、场景结构及空间关系上展现出强大的视觉推理能力。

目前该模型已向公众开放体验，但暂时仅限在 Arena 平台使用；官方博客预计其将在未来两周内陆续登陆 MAI Playground 和 Foundry。

相关链接：

https://microsoft.ai/news/mai-image-2-5-launches-at-no-3-on-arena-ai/

OpenMOSS 团队发布 MOSS-TTS-v1.5 与音效生成模型 MOSS-SoundEffect-v2.0 `#6`

OpenMOSS 团队发布 MOSS-TTS-v1.5 语音合成模型，将多语种支持扩展至 31 种并优化了语音克隆稳定性，同时推出采用 DiT 架构的音效生成模型 MOSS-SoundEffect-v2.0。

OpenMOSS 团队发布了新一代语音合成模型 MOSS-TTS-v1.5 及文本到音效模型 MOSS-SoundEffect-v2.0。

MOSS-TTS-v1.5 保留了零样本克隆等基础能力，将多语种支持扩展至 31 种，在指定语言标签时合成质量高于前代，同时改进了长参考音频短文本克隆与标点韵律跟随，并支持内联标记控制停顿。

音效模型 MOSS-SoundEffect-v2.0 拥有 13 亿 参数，采用 DiT 架构与 Flow Matching 目标，支持根据中英文文本生成长达 30 秒 的 48 kHz 高保真音效。

两款模型均已在 Hugging Face 开源并提供推理代码。

相关链接：

NVIDIA开源PiD解码器：统一解码与超分 `#7`

NVIDIA 推出像素扩散解码器 PiD，一种将 潜空间解码 与 超分辨率 统一为单一过程的 条件像素扩散模型。它兼容 Flux 和 SD3 等架构，权重已开放下载，仅限 非商业 用途。

NVIDIA正式发布了PiD（Pixel Diffusion Decoder），这是一种将潜空间解码与超分辨率统一为单一过程的条件像素扩散模型。

它通过直接在高分辨率像素空间进行去噪，取代了传统的“先解码后超分”级联流程，并利用DMD2蒸馏将推理步骤压缩至4步。

官方数据显示，PiD在RTX 5090上可将512分辨率的潜变量在不到1秒内解码为2048图像，在GB200上仅需210毫秒，比SeedVR2等基于级联扩散的超分流程快约5.9倍。

该模型针对多种主干架构的检查点已在Hugging Face开源，明确要求仅限用于非商业的研究或评估目的。

相关链接：

https://research.nvidia.com/labs/sil/projects/pid/

腾讯 Hy-MT2 模型更换为 Apache 2.0 协议 `#8`

腾讯官方宣布将 Hy-MT2 模型改为采用 Apache License 2.0 协议开源，无限制支持商业使用与微调。

腾讯已将其 Hy-MT2 模型的开源许可协议正式更改为 Apache License 2.0。

该协议允许社区在无任何附加限制的条件下，将模型用于学术研究、商业用途、微调以及创建衍生品。

根据官方提供的数据，该模型的两个版本目前在 Hugging Face 趋势排行榜上分别位列第一名和第四名。

相关链接：

https://x.com/TencentHunyuan/status/2059249996256711150

Anthropic 发布 Claude Code 安全审查插件 `#9`

Anthropic 发布 Claude Code 的 security-guidance 插件，可在编写代码时自动审查变更并修复常见安全漏洞，已面向所有用户开放。

Anthropic 发布了面向 Claude Code 的 security-guidance 插件，该插件在编码过程中自动运行，无需单独调用命令。

插件通过 三个层级 进行检查：文件编辑时的快速模式匹配（无模型调用）、每轮对话结束后的后台模型审查，以及 Claude 执行 git commit 或 git push 时的深度 Agent 审查，三个层级均不阻塞写入或提交操作。

该插件已面向所有 Claude Code 用户开放，用户可在会话中通过 /plugin install security-guidance@claude-plugins-official 从官方 Anthropic 插件市场安装，其中模型审查默认使用 Claude Opus 4.7，会产生相应的模型用量。

相关链接：

SpaceXAI 改进缓存并重置 Grok Build 额度 `#10`

SpaceXAI针对用户反馈Grok Build Beta迅速触达限制的问题，改进了相关缓存机制，并已重置所有账户的该功能使用额度。

SpaceXAI 官方确认，部分用户在测试 Grok Build Beta 时遇到了使用额度迅速耗尽的问题。

针对这一反馈，开发团队找到了优化 缓存 的方向并进行了改进。

目前官方已经重置了所有账户的 Grok Build 使用限制，同时团队鼓励用户继续分享测试反馈。

相关链接：

https://x.com/xai/status/2059375342683636066

OpenCode Go 上线 Qwen3.7 Max 模型 `#11`

OpenCode Go 套餐现已支持 Qwen3.7 Max 模型，仅限纯文本且提供 100 万 上下文。Arena.ai 称该模型在 Code Arena 首秀排第四。

OpenCode 官方宣布其 Go 套餐现已支持 Qwen3.7 Max 模型。

官方将该模型描述为 Qwen 家族迄今最聪明的模型，提供 100 万 上下文能力，但目前仅支持纯文本输入。

此外，据 Arena.ai 公布的评测数据，Qwen3.7 Max 在 Code Arena 榜单首次亮相排名第四，超越了 GLM-5.1 并与 Claude Opus 4.6 表现持平。

相关链接：

https://x.com/opencode/status/2059335771002114462

美团发布面向 AI Agent 的跑腿下单助手 Skill `#12`

美团发布面向 AI Agent 的 跑腿下单助手。该 Skill 支持直接调用美团跑腿接口完成 帮取送、帮忙 和 帮买 等场景，并内置地址搜索与订单查询功能。

美团在 GitHub 官方仓库发布了 MT-Paotui-For-Client 项目，这是一个面向 AI Agent 的跑腿下单助手 Skill。

该工具由用户自选的大模型驱动，支持直接调用美团跑腿接口完成帮取送、帮忙和帮买等场景，并内置地址搜索与订单查询功能。

该项目内置了两步确认及超 100 元 金额拦截等安全门控机制。美团官方声明仅提供跑腿接口与 Skill 定义，不对 AI 助手环境及大模型的安全合规性承担责任。

相关链接：

https://github.com/meituan/MT-Paotui-For-Client

支付宝推出全栈AI支付体系及首个Token Pay服务 `#13`

蚂蚁集团旗下支付宝正式发布由AI付、AI收、Token Pay和AI钱包构成的AI支付“全家桶”，建立覆盖授权、支付、结算和管理的全栈AI原生支付体系。

蚂蚁集团旗下支付宝正式发布由AI 付、AI 收、Token Pay和AI 钱包构成的AI支付“全家桶”，建立覆盖授权、支付、结算和管理的全栈AI原生支付体系。

官方数据显示，其核心产品“AI 付”已完成3 亿笔智能体支付，支持市面上**95%**的主流智能体框架，并覆盖手机、眼镜、车机等多终端硬件。

本次推出的Token Pay是目前市场唯一的模型付款解决方案，官方称采用订阅制可将模型订阅成功率提升70%；而AI 钱包则支持意图授权与24 小时风险预警，支付宝对此承诺“你敢付，我敢赔”。

同时，支付宝基于“碰一下”终端发布了首个商家经营智能体“晓雨”，并宣布推出包含每月最高5000 元Token算力补贴及费率减免的AI开发者激励计划，详细方案将于6 月公布。

相关链接：

https://mp.weixin.qq.com/s/WwcAM0SzMbSt-vD25TiAgg

秘塔AI搜索上线事实核验功能并扩容视频库 `#14`

秘塔AI搜索近期宣布扩容视频库十倍，提升搜索速度与深度，并新增“事实核验”功能，支持比对多方来源判断信息真伪，现已面向PC端开放。

秘塔AI搜索官方宣布在最近一个月内对其产品进行了三项核心更新。

平台不仅将视频搜索库的数据规模扩容至原有的10倍，还将搜索深度提升了33%、速度实现了翻倍，且性能提升同时覆盖 API 与产品端。

此外，秘塔新增了 “事实核验” 功能，能够自动识别上传内容中的事实细节，通过比对多方来源来判断信息可信度。

目前，用户已可在 PC端 首页使用该功能。

相关链接：

https://mp.weixin.qq.com/s/-9xXP8F1qW8Hy9yr5NLt1A

Datacurve 发布 DeepSWE 长周期软件工程基准 `#15`

Datacurve 团队推出软件工程基准 DeepSWE，含 91 个仓库的 113 项原创长周期任务，官方评测显示 gpt-5.5 以 70% 通过率排名第一。

Datacurve 团队发布了长周期软件工程基准 DeepSWE，包含横跨 TypeScript、Go、Python、JavaScript 和 Rust 五种语言。

该基准涵盖 91 个活跃开源仓库的 113 项从零编写的原创任务，旨在解决现有公开基准的数据污染与验证器不可靠问题。

官方公布的评测结果显示，在统一使用 mini-swe-agent 的条件下，gpt-5.5 以 70% 通过率居首。

gpt-5.4 和 claude-opus-4.7 分别为 56% 和 54%。

基准代码与全部运行轨迹已在 GitHub 公开。

相关链接：

蚂蚁集团与新加坡国立大学团队提出KPop训练方法 `#16`

蚂蚁集团等联合提出KPop方法，使用自适应二元KL 散度替代固定比率约束，以解决大规模MoE模型强化学习训练中的训练 - 推理不匹配问。

蚂蚁集团与新加坡国立大学团队提出名为KPop的强化学习训练稳定性方法。

该方法采用对称二元KL散度替代先前IcePop方法中的固定比率约束，能够根据不同Token的概率自适应调整遮蔽区域，从而更准确地捕获异构Token级别的训练-推理差异。

实验表明，在不修改RL基础设施或引入路由重放等额外机制的前提下，KPop在混合复杂推理任务和长程编码Agentic RL中均能稳定优化过程。

官方称使1T参数的Ring-2.6-1T模型在SWE-bench-Verified基准上取得超过76的分数。

相关链接：

https://ringtech.notion.site/kpop

OpenRouter 宣布完成 1.13 亿美元融资 `#17`

OpenRouter 宣布完成 1.13 亿美元 B 轮融资，本轮融资由 Alphabet 旗下的 CapitalG 领投。官方数据显示，该平台每周处理的 token 量已增长至 25 万亿。

OpenRouter 官方宣布了这笔 1.13 亿美元的 B 轮融资，领投方为 CapitalG，同时获得了 a16z、Menlo Ventures 以及 nvidia 旗下 NVentures 等多家投资机构的支持。

官方数据显示，随着 AI从实验阶段转向生产应用，OpenRouter每周处理的 token量在 六个月内从 5 万亿激增至 25 万亿。

另据 OpenRouter团队成员透露，该平台目前已拥有超过 800 万全球用户。

相关链接：

https://x.com/OpenRouter/status/2059277623629664758

MiniMax预热M3模型及MSA稀疏注意力架构 `#18`

MiniMax近日预告了M3模型及其使用的稀疏注意力架构MiniMax Sparse Attention。官方数据显示，在100 万token 长文本下，M3预填充速度较前代M2提升9.7倍，解码速度提升15.6倍。

MiniMax近日通过社交平台正式预告了M3模型及其使用的新一代稀疏注意力架构 MiniMax Sparse Attention（MSA）。

根据官方发布的性能对比，在处理1M tokens的超长上下文时，M3 的预填充延迟从M2的近20秒降至线性水平，解码延迟从约1.6毫秒被大幅压缩。

整体取得了9.7倍和15.6倍的提速。MSA采用“索引分支 + 稀疏分支”的两阶段设计：先由轻量索引分支筛选关键KV区块，再于稀疏分支中仅对选中区块执行注意力计算。

相关链接：

https://x.com/MiniMax_AI/status/2059286515155599595

提示：内容由AI辅助创作，可能存在幻觉和错误。

Contents

AI 早报 2026-05-27

概览

要闻

模型发布

开发生态

产品应用

技术与洞察

行业动态

前瞻与传闻

小米宣布 MiMo-V2.5 系列模型永久降价，优化 Token Plan 计费体系 #1

Kimi 升级风控误封 Kimi Code 用户，官方致歉并恢复账号 #2

Kwai-Keye 发布 Keye-VL-2.0-30B-A3B 多模态模型 #3

PrismML 发布 Bonsai Image 4B 开源图像模型 #4

微软发布文生图模型 MAI-Image-2.5 强化文本渲染能力 #5

OpenMOSS 团队发布 MOSS-TTS-v1.5 与音效生成模型 MOSS-SoundEffect-v2.0 #6

NVIDIA开源PiD解码器：统一解码与超分 #7

腾讯 Hy-MT2 模型更换为 Apache 2.0 协议 #8

Anthropic 发布 Claude Code 安全审查插件 #9

SpaceXAI 改进缓存并重置 Grok Build 额度 #10

OpenCode Go 上线 Qwen3.7 Max 模型 #11

美团发布面向 AI Agent 的跑腿下单助手 Skill #12

支付宝推出全栈AI支付体系及首个Token Pay服务 #13

秘塔AI搜索上线事实核验功能并扩容视频库 #14

Datacurve 发布 DeepSWE 长周期软件工程基准 #15

蚂蚁集团与新加坡国立大学团队提出KPop训练方法 #16

OpenRouter 宣布完成 1.13 亿美元融资 #17

MiniMax预热M3模型及MSA稀疏注意力架构 #18

小米宣布 MiMo-V2.5 系列模型永久降价，优化 Token Plan 计费体系 `#1`

Kimi 升级风控误封 Kimi Code 用户，官方致歉并恢复账号 `#2`

Kwai-Keye 发布 Keye-VL-2.0-30B-A3B 多模态模型 `#3`

PrismML 发布 Bonsai Image 4B 开源图像模型 `#4`

微软发布文生图模型 MAI-Image-2.5 强化文本渲染能力 `#5`

OpenMOSS 团队发布 MOSS-TTS-v1.5 与音效生成模型 MOSS-SoundEffect-v2.0 `#6`

NVIDIA开源PiD解码器：统一解码与超分 `#7`

腾讯 Hy-MT2 模型更换为 Apache 2.0 协议 `#8`

Anthropic 发布 Claude Code 安全审查插件 `#9`

SpaceXAI 改进缓存并重置 Grok Build 额度 `#10`

OpenCode Go 上线 Qwen3.7 Max 模型 `#11`

美团发布面向 AI Agent 的跑腿下单助手 Skill `#12`

支付宝推出全栈AI支付体系及首个Token Pay服务 `#13`

秘塔AI搜索上线事实核验功能并扩容视频库 `#14`

Datacurve 发布 DeepSWE 长周期软件工程基准 `#15`

蚂蚁集团与新加坡国立大学团队提出KPop训练方法 `#16`

OpenRouter 宣布完成 1.13 亿美元融资 `#17`

MiniMax预热M3模型及MSA稀疏注意力架构 `#18`