AI 早报 2026-05-28

视频版哔哩哔哩YouTube

概览

要闻

  • OpenAI Foundation 宣布投入 2.5 亿美元应对 AI 经济变革 #1

模型发布

  • Biohub 发布蛋白质生物学世界模型 ESMFold2 并全面开源 #2

开发生态

  • Claude Code 推出响应速度与可靠性优化更新 #3
  • Codex 将于 6 月 2 日下线 GPT-5.2 及 5.3-Codex 模型 #4
  • OpenCode 限时免费提供 MiMo V2.5 模型 #5
  • SuperGrok 及 X Premium+ 用户可在 Kilo Code 使用 Grok 模型 #6
  • OpenAI 推出 Secure MCP Tunnel 等多项企业级安全与管理功能 #7
  • 腾讯发布 AI 游戏创作平台“代号 Craft”并开启首测 #8
  • Cua 开源 Cua Driver Windows 版,支持后台控制桌面应用 #9
  • Runway 推出 Runway MCP 服务 #10

产品应用

  • Meta推出三大应用Plus订阅服务并测试Meta One计划 #11
  • NotebookLM 推出 Google Drive 文件自动同步功能 #12
  • Sesame 推出 iOS 应用预览版,首发多款个人 Agent #13
  • YouTube 引入自动检测机制主动标记 AI 生成视频 #14
  • 千问升级“拍照问健康”功能 #15

技术与洞察

  • OpenAI 发文介绍与 Thrive Holdings 联合开发基于 Codex 的自我改进税务 Agent #16
  • Artificial Analysis 与 IBM 推出企业级 IT Agent 基准 ITBench-AA #17
  • Claude 推出 AI Agent 零信任架构指南 #18
  • Anthropic 报告:仅 20% 社会科学家常态化使用编码 Agent #19

行业动态

  • Cognition 融资超 10 亿美元,估值达 260 亿美元 #20

OpenAI Foundation 宣布投入 2.5 亿美元应对 AI 经济变革 #1

OpenAI Foundation 宣布初步投入 2.5 亿美元资金,用于应对 AI 带来的经济变革,重点投资于经济影响测量、劳动者过渡支持及建立长期经济保障机制。

OpenAI Foundation 宣布投入初始 2.5 亿美元,用于在 AI 时代建设安全丰富的经济未来并广泛分享经济收益。

这笔资金将通过赠款、公开征集和机构合作支持外部组织,重点覆盖三大领域:投资独立的测量与预测基础设施以了解 AI 的经济影响、为经历短期冲击的工人和社区提供支持,以及探索长期的政治经济组织新方法。

基金会还将建立内部团队直接推进相关工作,并预计在 今年晚些时候 公布首批具体倡议。

相关链接:


Biohub 发布蛋白质生物学世界模型 ESMFold2 并全面开源 #2

Biohub 宣布发布蛋白质生物学 “世界模型”,包含语言模型 ESMC、结构预测模型 ESMFold2 及涵盖 68 亿 序列的 ESM Atlas

Biohub 正式发布了新一代蛋白质生物学“世界模型”系统。

核心包含最新语言模型 ESMC、预测模型 ESMFold2 以及包含 68 亿 序列的 ESM Atlas

官方称 ESMFold2 在抗体-抗原等复杂结构预测上达到 SOTA 水平。

并在未针对特定靶点微调的情况下,通过计算成功设计出针对 五个 肿瘤与免疫学靶点的高亲和力微型蛋白结合物与单链抗体。

目前,上述模型及工具已通过 Biohub 平台正式上线,并全部采用允许商业及非商业用途的 MIT 协议开源。

相关预印本论文也同步公开。

相关链接:


Claude Code 推出响应速度与可靠性优化更新 #3

Claude Code宣布推出一系列优化更新。新版引入全屏渲染器解决闪屏,实现思考工具调用流式输出,并修复上下文压缩报错与MCP连接失败问题。会话遇超大媒体文件现支持自动恢复

ClaudeDevs 官方公布了 Claude Code 的多项更新,旨在提升响应速度与可靠性。

此次更新引入了修复屏幕闪烁等 Bug 的全新全屏渲染器,实现了思考与工具调用的流式输出。

并修复了上下文压缩时的 “prompt too long” 错误与 MCP 连接失败等长期存在的问题。

新版增加了一键发送过去 一天一周 会话记录的反馈功能,并支持会话在遇到超大媒体文件时自动恢复。

相关链接:


Codex 将于 6 月 2 日下线 GPT-5.2 及 5.3-Codex 模型 #4

Codex 负责人 Tibo 宣布,对于通过 ChatGPT 账号登录 Codex 的用户,将于 6 月 2 日 下线 GPT-5.2GPT-5.3-Codex 模型,GPT-5.3-Codex-Spark 不受此次调整影响。

Codex 负责人 Tibo 通过社交平台宣布,为了简化 Codex 算力集群管理,将在 6 月 2 日 正式下线 GPT-5.2GPT-5.3-Codex 模型。

此次调整仅针对通过 ChatGPT 账号登录 Codex 的用户,免费用户的默认前沿模型将切换为 GPT-5.5

Tibo 透露,自去年 12 月 发布的 GPT-5.2 目前在生产环境中的使用率已不足 1%,官方认为其已相当过时。

不过,被下线的模型将继续在 API 中保持可用,且 GPT-5.3-Codex-Spark 确认不在此次下线范围内。

相关链接:


OpenCode 限时免费提供 MiMo V2.5 模型 #5

OpenCode 官方宣布,限时免费提供 Xiaomi MiMo V2.5 模型。该模型支持 1M 上下文,并具备文本、图像输入及推理能力。

OpenCode 官方宣布推出限时免费活动,向用户开放 Xiaomi MiMo V2.5 模型。

该模型支持 1M 上下文窗口,并集成了推理、文本和图像处理等多模态能力。

目前该服务为限时免费,具体截止时间暂未明确,有社区用户对此规模的免费资源表示关注。

相关链接:


SuperGrok 及 X Premium+ 用户可在 Kilo Code 使用 Grok 模型 #6

SpaceXAI 宣布与 Kilo Code 达成合作。拥有 SuperGrokX Premium+ 订阅的用户即日起可通过 OAuth 授权,调用 grok-build-0.1 等最新 Grok 模型。

SpaceXAI 官方宣布其 Grok 模型已正式集成至开源 agentic 工程平台 Kilo Code

拥有 SuperGrokX Premium+ 订阅的用户,现可在该平台的 VS CodeJetBrains 扩展或 CLI 中,直接使用专为高速和 agentic coding 打造的 grok-build-0.1 等最新模型。

用户只需通过 OAuth 流程连接 Grok 账户即可启用,无需配置单独的 API 密钥。

官方同时预告未来将推出更多开源 Agent 与相关集成。

相关链接:


OpenAI 推出 Secure MCP Tunnel 等多项企业级安全与管理功能 #7

OpenAI 官方宣布推出 Secure MCP TunnelWorkload Identity Federation 并扩展 Admin API,旨在帮助企业更安全地集成内部系统并实现平台自动化管理。

OpenAI 官方宣布推出三项面向企业的平台更新。

其中 Secure MCP Tunnel 允许私有或本地 MCP 服务器通过仅出站的 HTTPS 连接到 ChatGPTCodex 等产品,无需将服务器暴露于公网。

Workload Identity Federation 支持使用来自 AWSAzure 等环境的短期 OIDC 令牌换取 OpenAI 访问凭证,减少静态 API 密钥的分发。

扩展后的 Admin API 新增了支出警报、模型访问控制、数据保留和成本可见性等编程式项目管理能力。

相关链接:


腾讯发布 AI 游戏创作平台“代号 Craft”并开启首测 #8

腾讯发布全新 AI 游戏创作平台“代号 Craft”,支持用户通过自然语言生成 2D3D 游戏原型,目前平台已正式开启首测报名。

SPARK2026 腾讯游戏 发布会上,腾讯游戏生态发展部 正式发布了 AI 游戏创作平台 “代号 Craft”

该平台允许用户通过自然语言对话,自动生成包含美术设计和基础玩法逻辑的 2D3D 游戏原型。

生成的雏形可一键导出并无缝适配 Unity 等主流商业引擎。

平台内置了包含超过 一万种 预制美术资源的免费资产库与 AIGC 工具链,旨在降低非专业开发者和小型团队的技术与产能门槛。

目前,“代号 Craft” 已开启首测报名。

腾讯 将联合 深圳前海 共同启动 “开发者先锋营” 线下训练营活动。

相关链接:


Cua 开源 Cua Driver Windows 版,支持后台控制桌面应用 #9

Cua 宣布 Cua Driver 正式支持 Windows 平台的后台计算机使用,允许 Agent 在不干扰用户操作的情况下控制各类桌面应用,并支持多合成指针。

Cua 官方宣布, Cua Driver 现已支持 Windows 平台的后台计算机使用。

该驱动程序作为路由器运行,兼容 Win32WPFUWPElectron 等多种架构,可为接入的 Agent 同时提供窗口像素、UIA/MSAA 辅助功能树以及操作层。

开发者可通过 CLIMCP 将其接入 Claude CodeCodexHermes 等循环中,驱动默认在后台执行,系统会为每个 Agent 绘制独立的合成光标,从而保持用户物理桌面的可用性。

对于必须占据前台的操作或通过 SSH 运行的无桌面会话,该驱动提供明确的错误返回机制与守护进程进行应对。

相关链接:


Runway 推出 Runway MCP 服务 #10

Runway 宣布推出 Runway MCP。通过该服务,用户可在 ClaudeCursor 等任何兼容 MCPAgent 内直接生成图像与视频。

Runway 正式发布了 Runway MCP,这是一项能够将其生成能力接入各类 Agent 与编码工具的 MCP 服务器。

连接该服务后,用户只需向 Agent 发送产品 URL、参考图像或文本提示词,即可在当前对话窗口内获取生成的图像和视频结果。

官方称该功能支持 Gen-4.5Seedance 2.0GPT Image 2Kling 3.0 以及 Nano Banana Pro 等最新模型。

目前该功能已开放使用。用户在兼容客户端添加特定的服务器 URL 并登录 Runway 账户即可完成接入。

全程无需额外的 API 密钥。生成内容受限于用户当前的 Runway 订阅计划。

相关链接:


Meta推出三大应用Plus订阅服务并测试Meta One计划 #11

Meta近日宣布面向全球推出InstagramFacebookWhatsApp的Plus订阅服务,并同步在多国开启整合AI与企业服务的“Meta One”测试。

据媒体报道,Meta宣布面向全球推出旗下三大社交应用的消费者订阅计划,同时启动面向企业、创作者及AI用户的全新订阅服务测试。

消费者可分别以每月 3.99美元2.99美元 订阅 Instagram PlusFacebook PlusWhatsApp Plus,获取个性化社交与消息体验,且上述服务独立于现有的 Meta Verified

此外,Meta计划将未来服务统一整合至“Meta One”品牌,将于下月起在新加坡等地测试包含AI算力与生成能力的PlusPremium套餐,并于本周晚些时候沙特阿拉伯等地测试面向企业与创作者的Essential及高级套餐。

相关链接:


NotebookLM 推出 Google Drive 文件自动同步功能 #12

NotebookLM 宣布推出 Google Drive 文件自动同步功能。该功能目前已启动推送,首批面向 10% 的用户开放,并将在后续逐步扩大范围。

Google官方宣布,NotebookLM现已开始推出Google Drive文件自动同步功能,Google CEO Sundar Pichai也转发确认了此项更新。

Google负责人Josh Woodward透露,这是用户呼声最高的功能请求之一。

目前,该功能正处于活跃的逐步推送阶段,初期首批仅面向 10% 的用户开放体验。

官方确认,在完成初期的部署后,后续将很快向更多用户普及,并逐步扩大整体的可用性范围。

相关链接:


Sesame 推出 iOS 应用预览版,首发多款个人 Agent #13

Sesame 推出 iOS 应用预览版,首发多款用于日常对话的个人 Agent。应用正逐步向多国开放,Android 版已在路线图中。

Sesame 正式宣布推出 iOS 应用预览版,带来一系列专为日常对话设计的个人 Agent

官方称其带来了新功能、新角色(如 MayaMiles),并实现了边说话边思考的交互体验。

该预览版已上线并正逐步向更多国家推出。

此外,团队确认 Android 版在开发路线图中,并预告将在 2027 年 推出智能眼镜。

相关链接:


YouTube 引入自动检测机制主动标记 AI 生成视频 #14

YouTube 宣布引入自动 AI 检测系统,将主动为“逼真的 AI”生成内容添加标签,该标签会直接显示在长视频与 Shorts 播放界面上,同时平台将在未来几周向所有 18 岁以上频道全面开放 AI 深度伪造肖像检测技术

YouTube 官方宣布将改变此前依赖创作者手动披露的规则,通过内部系统主动识别并标记使用了逼真 AI 技术的视频内容。

为了让观众更容易察觉,新的 AI 标签 将直接展示在长视频播放器下方以及 Shorts 短视频界面上,而轻微修改或明显不真实的动画内容仍只在简介中显示。

据媒体报道,官方确认该标签不会影响视频的推荐与商业化变现,但使用 YouTube 自有工具(如 Veo)或带有 C2PA 元数据的视频将无法移除该标签。

相关链接:


千问升级“拍照问健康”功能 #15

千问APP升级拍照问健康功能,支持上传检查单等图像,系统会圈定异常并结合知识库推理给出参考。官方邀请三甲医生验证了其具备鉴别诊断等专业能力。

千问APP的 “拍照问健康” 功能迎来进一步升级。

支持用户上传检查单或患处照片等医学图像进行推理分析。

系统能在图像中圈出异常区域,调用专业健康知识库并结合用户情况逐步推理,最终给出诊断参考

官方邀请了北京协和北京友谊北大人民医院三甲医院主任医师参与体验。

医生评测认为该系统具备使用特定年龄段参考范围交叉排除分析及提供多种鉴别诊断等专业看诊思路。

相关链接:


OpenAI 发文介绍与 Thrive Holdings 联合开发基于 Codex 的自我改进税务 Agent #16

OpenAI 发文介绍与 Thrive Holdings 联合开发了税务 Agent“Tax AI”。该系统基于 Codex 构建,通过将审查人员的纠错转化为结构化信号,实现在真实税务处理中的自主迭代与自我改进。

OpenAI 发文介绍其与 Thrive Holdings 合作,为拥有超过 30 家会计师事务所的 Crete 网络联合开发了名为 Tax AI 的自主改进型税务 Agent

根据官方提供的数据,在本税务季的试点中,该系统处理了 7000 份税务申报,将税务准备时间缩短了约三分之一,吞吐量提高了约 50%,并且起草的申报准确率高达 97%

该系统的核心在于由 Codex 驱动的三部分循环:捕获从业者的修正,将其转化为带有生产追踪的结构化评估,然后由 Codex 调查故障,提出代码修复建议,并在发布前进行验证。

目前,该团队正将相同的设计蓝图应用于 Thrive Holdings 内部的其他领域,如簿记、审计和 IT 服务台自动化。

相关链接:


Artificial Analysis 与 IBM 推出企业级 IT Agent 基准 ITBench-AA #17

Artificial AnalysisIBM Research 推出首个企业级 IT Agent基准 ITBench-AA,官方数据显示前沿模型在 SRE 任务中最高得分未达 50%

Artificial AnalysisIBM Research 联合推出 ITBench-AA,这是首个专注于评估模型在企业级 IT Agent 任务表现的基准测试。

首期聚焦于 Kubernetes 站点可靠性工程事件响应。

该基准要求模型在沙盒文件系统中读取日志、追踪依赖并识别根本原因实体。

官方评测结果显示,所有前沿模型得分均低于 50%

其中 Claude Opus 4.747% 的得分位列第一。

但开源模型在性价比上表现更优。

相关链接:


Claude 推出 AI Agent 零信任架构指南 #18

Claude 官方发布了面向企业自主 **AI Agent** 的零信任安全框架指南,提出采用三层安全架构与八阶段实施工作流,以应对相关新型威胁。

Claude 官方发布了针对企业部署自主 AI Agent 的零信任安全框架指南。

该指南详细说明了 Agent 系统在工具访问和自主决策等方面面临的 提示注入工具投毒内存投毒等新型威胁。

为应对这些风险,框架提出了包含基础、高级和优化三个层级的零信任架构,以及涵盖身份验证访问范围界定沙箱等八个阶段的实施工作流。

此外,指南还介绍了应对 AI 加速攻击的自主安全运营方法。

并为医疗保健金融政府等受监管行业提供了合规性对齐建议。

相关链接:


Anthropic 报告:仅 20% 社会科学家常态化使用编码 Agent #19

Anthropic 发布针对 1260 名定量社会科学家的调查报告。数据显示,81% 的受访者曾尝试 AI 聊天机器人,但仅 20% 每周常态化使用 Claude Code编码 Agent

202623月,Anthropic调查了1260名定量社会科学家。

**81%曾用生成式AI,仅20%**每周常态化使用编码Agent

其采用存在显著不平等:经济学家最高;男性是女性两倍;顶尖大学高40%早期职业者更常用。

描述性数据表明,使用者产出更多工作论文基金申请,但期刊投稿量无差异。

团队强调,产出差异不具因果推论性,且样本存在自选择偏差

相关链接:


Cognition 融资超 10 亿美元,估值达 260 亿美元 #20

Cognition 官方宣布完成超过 10 亿美元融资,估值达 260 亿美元。

Cognition 官方宣布已完成超过 10 亿美元 的新一轮融资,公司估值达到 260 亿美元

本轮融资由 Lux CapitalGeneral Catalyst8VC 领投。

该团队推出的 AI 软件工程师 Devin 的企业级使用量自今年年初以来增长超过 10 倍

官方称其运行费率收入已增长至 4.92 亿美元

Cognition 定位为 独立 Agent 实验室,其内部目前有 89% 的工程师代码提交由 Devin 完成。

该产品现已面向外部企业及开发团队提供服务。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误