AI 早报 2026-05-16

视频版哔哩哔哩YouTube

概览

要闻

  • SpaceXAI 开放 Grok 订阅连接 Hermes Agent #1
  • Anthropic 重置全体用户速率限制 #2

模型发布

  • 上海人工智能实验室发布 Intern-S2-Preview 模型 #3
  • Boson AI 推出实时数字人基础模型 Higgs Avatar v1 #4

开发生态

  • Zed 的 Zed agent 新增支持 ChatGPT 订阅接入 #5
  • 阿里发布Qoder 1.0 升级为Agent自主开发工作台 #6
  • 通义灵码更名 Qoder CN,升级 Credits 计费并调整价格 #7
  • LongCat 宣布将于 5 月 29 日下线 6 款旧模型 #8
  • OpenAI Codex 团队正调查 GPT-5.5 表现变差报告 #9

产品应用

  • 千问APP与国家药监局信息中心达成合作 #10
  • OpenAI 向美国 Pro 用户推出 ChatGPT 个人金融体验预览版 #11

技术与洞察

  • Elon Musk 开源 X 平台“For You”信息流最新推荐算法 #12

行业动态

  • 媒体报道 OpenAI 重组高管团队,将整合 ChatGPT 与 Codex 发力 AI Agent #13
  • 报道称百度设立模型委员会由年轻研究员掌舵 #14

前瞻与传闻

  • 马斯克透露,参数量共1.5万亿的Grok新模型即将发布 #15

SpaceXAI 开放 Grok 订阅连接 Hermes Agent #1

SpaceXAI 宣布 Grok 订阅现已直接集成至 Hermes Agent。用户通过 OAuth 授权,即可在 Hermes Agent 内直接调用 Grok 4.3Grok TTS,并能利用 Grok Imagine 生成图像和视频。

SpaceXAI 宣布 Grok 订阅现已支持连接至 Nous Research 开发的 Hermes Agent

该功能向所有层级的 Grok 订阅用户开放,用户只需通过 Grok OAuth 授权登录即可启用,无需复杂设置。

连接后,用户可在 Agent 中使用 Grok 4.3 进行高级推理对话,获取 Text-to-Speech 语音响应,并利用 Grok Imagine 生成图像和视频。

SpaceXAI 表示,未来还将推出更多开源 Agent 的集成。

相关链接:


Anthropic 重置全体用户速率限制 #2

Anthropic 通过官方开发者账号 ClaudeDevs 宣布,已为全体用户重置 五小时每周 的速率限制。

Anthropic 通过官方开发者账号 ClaudeDevs 宣布,已为全体用户重置五小时及每周速率限制。

此次重置使用户的使用计数在本周期内重新计算,无需等待即可继续使用 Claude

该调整即时生效,面向所有用户,但 Anthropic 未说明具体原因,社区猜测或与市场竞争有关。

相关链接:


上海人工智能实验室发布 Intern-S2-Preview 模型 #3

上海人工智能实验室发布 35B 科学多模态模型 Intern-S2-Preview。官方称其核心表现媲美万亿参数规模模型,并首发材料晶体结构生成能力。

上海人工智能实验室正式推出 Intern-S2-Preview,这是一款参数量为 35B 的高效科学多模态基础模型。

官方表示,该模型在核心科学任务上的表现可媲美万亿参数规模的 Intern-S1-Pro,并且是首个具备材料晶体结构生成能力及强通用能力的开源模型。

在能力提升方面,其在多项基准测试中的 Agent 能力得到显著增强。

为了优化推理效率,该模型通过共享权重的 MTP 结合 KL 损失提升了 MTP 接受率和 token 生成速度。

同时利用 CoT 压缩技术在保留强推理能力的同时缩短了响应长度。

目前,相关模型文件和代码已在 HuggingFaceModelScopeGitHub 上公开,用户可通过官方指定平台进行体验。

相关链接:


Boson AI 推出实时数字人基础模型 Higgs Avatar v1 #4

Boson AI 推出其实时数字人基础模型 Higgs Avatar v1 的私有预览版。该模型仅需单张静态图片即可生成与语音实时同步的交互面部。

Boson AI 宣布推出实时虚拟形象基础模型 Higgs Avatar v1,目前该模型处于私有预览阶段并已开放候补名单注册。

该产品能够仅凭单张静态图片生成可实时说话、倾听和反应的交互式面部画面,并与自研的 Higgs Audio 模型联合设计,以实现唇形、表情和头部动作的精准同步。

根据官方提供的数据,其画面生成速度约为 16 毫秒每帧,低于实时对话所需的 62.5 毫秒阈值

且单张 H100 GPU 可同时承载 8 路并发对话

据社区演示视频显示,基于该技术的数字人 Agent 具备响应迅速、支持实时打断及调用日历等外部工具的能力。

相关链接:


Zed 的 Zed agent 新增支持 ChatGPT 订阅接入 #5

代码编辑器 Zed 宣布用户现已能在其 Zed agent 中直接使用现有的 ChatGPT 订阅。

代码编辑器 Zed 官方宣布,现已支持用户在 Zed agent 中直接使用其 ChatGPT 订阅。

该功能将适用与用户在 Codex 中完全一致的用量及频率限制,确保订阅权益在第三方工具中得到延续。

Zed 团队特别致谢 OpenAI 在其他平台逐渐转向按量计费模式的背景下,依然对第三方工具维持订阅制访问的支持。

OpenAI 方面的 Kath Korevec 也对此次将该模型引入这款开源编辑器的合作表达了肯定。

相关链接:


阿里发布Qoder 1.0 升级为Agent自主开发工作台 #6

阿里正式发布Qoder 1.0,宣布将该平台从AI IDE升级为Agent自主开发工作台。用户仅需定义需求,Agent团队即可自主完成执行与交付。

阿里正式发布 Qoder 1.0,将平台从 AI IDE 升级为 Agent 自主开发工作台。目前,Windows、macOS 和 Linux 系统用户均可下载使用。

开发者只需定义需求,Agent 团队即可自主完成执行、验证和交付全流程。

该版本新增跨项目多任务并行、统一的团队级知识引擎以及自定义 Agent 专家团等功能,并对底层 Agent Harness 进行了系统性重构。

相关链接:


通义灵码更名 Qoder CN,升级 Credits 计费并调整价格 #7

阿里云近期宣布将通义灵码更名为 Qoder CN,并全面升级为基于 Credits 的计费体系并调整套餐价格。

阿里云近期宣布智能编码助手"通义灵码"更名为 Qoder CN,将全面升级为基于 Credits 的新计费体系,并同步调整了个人与企业的多档套餐价格及权益。

在个人版方面,新推出免费的个人社区版(每月 100 Credits)及 59 元/月的个人专业版(每月 2000 Credits),两者均仅限阿里云主账号开通或购买。

企业版方面,企业标准版和企业 VPC 版的席位月租分别上调至 99 元和 199 元,每月每席位均提供 3000 Credits。

相关链接:


LongCat 宣布将于 5 月 29 日下线 6 款旧模型 #8

美团LongCat 宣布将于 5 月 29 日下线 6 款旧模型 API,目前已停发旧模型新用户免费额度,新模型内测每日限量开放申请。

美团 LongCat 发布服务调整通知,为集中资源支持 LongCat-2.0-Preview 的测试与迭代,将于 2026 年 5 月 29 日 起停止 6 款旧模型的调用服务。

2026 年 5 月 15 日 起,平台已停止向新注册用户发放旧模型的免费额度,建议用户提前做好模型迁移规划。

目前,LongCat-2.0-Preview 内测名额于每日 09:00(UTC+8) 限量开放,并计划逐步扩大名额数量。


OpenAI Codex 团队正调查 GPT-5.5 表现变差报告 #9

OpenAI Codex 团队正调查 GPT-5.5 对部分用户表现变差的报告。官方称系统运行健康,尚未得出确切结论,将随时更新进展。

针对GPT-5.5对部分用户表现变差的反馈,OpenAI Codex团队已启动调查。

官方在社交平台 X 上澄清,当前系统整体运行健康,暂未得出确切结论,后续会持续同步进展。

此外,有社区用户猜测修复问题后官方是否会重置用户的调用额度,但该说法仅停留在社区讨论层面。

相关链接:


千问APP与国家药监局信息中心达成合作 #10

千问APP宣布与国家药监局信息中心达成合作,接入药品、医疗器械及化妆品权威数据,目前正抓紧消化相关数据以提供用药及产品指导。

近日,千问 APP国家药监局信息中心正式达成合作,基于相关数据共同开展数据治理与应用。

接入权威数据后,该应用在回答用药问题时将对照可靠的用药指导细节,并支持核对药品国家审批信息、提示不良反应,以及查询化妆品成分和把关医疗器械。

目前,千问 APP正在抓紧“消化”相关数据信息,并将持续跟随官方进行数据同步更新。

相关链接:


OpenAI 向美国 Pro 用户推出 ChatGPT 个人金融体验预览版 #11

OpenAI 近日向部分美国 Pro 用户推出了 ChatGPT 个人金融体验预览版,该功能允许用户绑定银行、投资账户并基于真实数据获取 AI 建议。后续将下放至 Plus 用户并最终向所有人开放。

OpenAI 为美国 Pro 用户推出了一项个人金融体验预览版,初期仅向较小群体开放。用户可通过网页端或 iOS 端连接银行、投资及信用卡账户。

内部评测中,超过 50 位金融专业人士对复杂理财任务进行评分。GPT-5.5 Thinking79 分,GPT-5.5 Pro82.5 分(满分 100)。

账户连接后,ChatGPT 能读取余额与交易记录,但看不到完整账号,也不能执行任何动账操作。用户可随时断开连接,同步数据将在 30 天内删除。专门的“财务记忆”可单独查看和删除,临时对话也不会访问账户数据。

OpenAI 同时与 Intuit 合作,未来可在聊天内直接提交信用卡申请或预约税务顾问。该功能后续将下放至 Plus 用户并最终向所有人开放。

相关链接:


Elon Musk 开源 X 平台“For You”信息流最新推荐算法 #12

Elon Musk 宣布 X 平台最新的"For You"信息流推荐算法已在 GitHub 开源。

Elon Musk 宣布 X 平台最新的"For You"信息流推荐算法已在 GitHubApache 2.0 许可证开源。

根据公布的代码,2026 年 5 月 15 日 的更新新增了端到端推理流水线、约 3 GB 的预训练迷你 Phoenix 模型,以及用于内容理解的 Grox 流水线和广告混合系统。

有社区讨论指出该算法使用 Rust 重写。分析认为,由于具体互动参数权重仍保密,最大化停留时间是目前提升帖子曝光的关键。

相关链接:


媒体报道 OpenAI 重组高管团队,将整合 ChatGPT 与 Codex 发力 AI Agent #13

据报道,OpenAI 正式任命总裁 Greg Brockman 全面领导产品战略,计划全力投入 AI Agent,将 ChatGPTCodex 整合为单一平台体验。

据媒体报道,OpenAI 宣布了最新的组织架构重组,正式任命联合创始人兼总裁 Greg Brockman 全面领导公司的产品战略及扩展业务。

根据被曝光的内部备忘录,OpenAI 计划将今年的产品策略全面聚焦于 AI Agent,致力于投资单一的 Agent 平台,并将 ChatGPTCodex 合并为一个统一的体验。

为此,其产品团队被重组为多个支柱部门,涵盖核心产品、企业行业及消费者领域,分别由现任负责人管理。

此次重组也是 OpenAI 在面临投资者盈利压力及潜在 IPO 背景下,停止资源分散、聚焦核心收入驱动力的战略延续。

相关链接:


报道称百度设立模型委员会由年轻研究员掌舵 #14

据媒体报道,百度近日成立百度模型委员会作为大模型战略最高决策机构。该机构由年轻研究员组成,统筹基础与应用研发部门,以打通技术与产品落地的全链路。

据媒体报道,百度近日成立了百度模型委员会,作为公司大模型战略的最高决策与协调机构。

该委员会由一批具备算法、工程与产品化复合经验的年轻研究员组成。基础模型研发部应用模型研发部将直接向其汇报。

此举旨在打破基础研发与应用落地之间的壁垒,实现从底层技术到上层产品的全链路统一管理。

该机构还将负责制定技术路线图、资源分配及跨部门协作机制。

相关链接:


马斯克透露,参数量共1.5万亿的Grok新模型即将发布 #15

马斯克确认 SpaceX AI 正在研发参数量达 1.5TV9 模型,针对 Blackwells 进行优化,表现显著优于前代,后续还将加入 Cursor 数据进行补充训练。

Elon Musk 澄清了 Grok 的版本号混淆问题,确认 SpaceXAI 内部正在研发参数量达 1.5T 的全新基础模型 V9

该模型针对 Blackwells 架构进行了优化,在数据整理和训练方案上均显著优于参数量为 0.5T 的前代 V8 模型(即公开的 v4.2)。

Musk 表示 V9 的初步训练已完成且效果出色,后续还将加入 Cursor 数据进行补充训练。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误