AI 早报 2026-05-10

视频版哔哩哔哩YouTube

概览

模型发布

  • 百度宣布文心 5.1 模型正式上线 #1
  • HiDream-ai 开源 HiDream-O1-Image 图像生成模型 #2

开发生态

  • OpenRouter 推出 Pareto Code 实验性编码路由 #3

技术与洞察

  • OpenAI 公开内部 Codex 安全运行实践 #4
  • Perplexity 公开内部 Agent Skills 设计维护指南 #5

行业动态

  • Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 #6
  • 消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 #7

前瞻与传闻

  • 报道称字节跳动今年 AI 基建支出超两千亿 #8

百度宣布文心 5.1 模型正式上线 #1

百度宣布文心 5.1大模型正式上线,用户可登录官网或星河社区 Playground体验。该模型总参数较前代压缩至三分之一,预训练成本仅为同规模百分之六。现正陆续上架数十个创作 Agent 平台。

百度宣布 文心 5.1 大模型已于即日起正式上线,用户可登录官网或通过星河社区 Playground 进行体验。

该模型基于 文心 5.0 进行架构创新,总参数量压缩至原版的约 1/3,激活参数量压缩至约 1/2。其预训练成本仅为业界同规模模型的约 6%

在模型能力上,文心 5.1Arena 搜索榜上以 1223 分取得全球第四、国内第一的成绩。在 GPQAMMLU-Pro 评测中,该模型的世界知识与创意写作能力亦表现领先,创意写作能力在内部评测中接近 Gemini 3.1 Pro

技术方面,研发团队引入了多维度弹性预训练技术与 Once-for-All 弹性训练框架。通过分离式全异步强化学习架构、FP8 训推一致性优化及资源异构弹性调度来支持高效稳定的训练。同时采用以多教师在线策略蒸馏为核心的后训练管线,以并行专家训练与统一能力融合解决多目标优化冲突。

此外,文心 5.1 在创意写作领域获得了创作类企业与专业作家的广泛赞誉,并将陆续上线 ISEKAI ZERO 等数十个创作类 Agent 平台。

相关链接:


HiDream-ai 开源 HiDream-O1-Image 图像生成模型 #2

HiDream-ai 团队开源了 8B 参数的图像生成模型 HiDream-O1-Image。该模型基于统一 Transformer 架构,无需外部 VAE 即可原生生成 2048 分辨率图像。

HiDream-ai 团队开源了其原生统一图像生成基础模型 HiDream-O1-Image(代号 Peanut),该模型包含未蒸馏(full)和蒸馏 Dev 两个变体,并同步发布了推理驱动的 Prompt Agent

HiDream-O1-Image 参数量为 8B,基于像素级统一 TransformerUiT)。它无需外部 VAE 或分离式文本编码器,直接在单一共享 Token 空间中编码原始像素、文本及任务条件。

该模型支持文生图、图像编辑、主体驱动个性化等任务,原生分辨率可达 2048×2048。在 Artificial Analysis Text to Image Arena 中,该模型首次上榜即位列第 8

官方称其已成为新晋领先的开放权重文生图模型。该项目代码库及模型权重均已以 MIT 许可证发布在 GitHubHuggingFace

相关链接:


OpenRouter 推出 Pareto Code 实验性编码路由 #3

OpenRouter推出了实验性编码路由Pareto Code。该路由会根据ArtificialAnalysis排名,自动把任务分配给满足分数要求且成本最低的模型,并提供了提速的Nitro版本。

OpenRouter近日推出实验性编码路由Pareto Code。开发者设置min_coding_score参数后,系统会依据ArtificialAnalysis排名,自动将任务定向至满足分数要求且成本最低的模型。

该路由设3个质量频带,共含13个模型,最高支持2M上下文。针对低延迟场景,另提供牺牲多样性换取速度的Nitro变体。

OpenRouter称,因模型快速迭代,数月内各频带成本降10100倍,该产品旨在顺应此趋势。该功能现已开放试用。

相关链接:


OpenAI 公开内部 Codex 安全运行实践 #4

OpenAI近期分享了一篇关于其如何在内部安全运行 Codex 的技术实践文章,重点介绍了沙箱执行边界、审批策略、自动审核模式、网络策略、身份验证绑定、命令规则以及 Agent 原生遥测等控制措施。

OpenAI 近期发文分享其内部安全部署编程 Agent Codex 的技术实践。

该文章显示,OpenAICodex 设定了清晰的技术边界,通过沙箱限定可写路径与网络访问,结合审批机制区分低风险与高风险操作,并启用 Auto-review 功能自动批准常规请求以降低人工中断频率。

网络策略默认不开放任意出站,仅允许经批准的域并通过缓存进行网络搜索,同时将 CLIMCP OAuth 凭据存入操作系统安全密钥环,强制通过 ChatGPT 登录并绑定至企业工作区以集中管控。

在遥测方面,Codex 支持通过 OpenTelemetry 导出用户提示、工具审批决策、MCP 服务器使用和网络代理允许/拒绝等事件日志,并已集成至 OpenAI 合规平台,帮助安全团队理解 Agent 行为意图。

目前相关配置方案与合规 API 已面向企业及教育用户开放。

相关链接:


Perplexity 公开内部 Agent Skills 设计维护指南 #5

Perplexity 发文介绍其内部 Agent Skills 的设计与维护指南。其指出:构建 Skill 需先编写评估,抓住描述中的触发词,用层级组织复杂知识,再通过记录失败案例的 gotchas 飞轮持续维护。

Perplexity Research 近期公开了其内部使用的 Agent Skills 设计、优化与维护指南。这份源自 Perplexity Computer 产品实践的文档,旨在将相关经验开放给社区。

根据指南,Agent Skill 是一个由 SKILL.mdscripts/references/ 等文件组成的多级目录。它依靠以"Load when..."开头的描述进行隐式路由匹配,并通过索引、加载、运行时三层渐进式上下文机制实现按需调用。

开发 Skill 的理念与传统代码截然不同,官方提出了"Skills 之禅"等对比。文档系统讲解了何时需要 Skill,以及如何从编写评估和描述入手。同时,文章详细介绍了利用层级结构和迭代来构建 Skill 的方法。

在维护方面,指南阐述了如何借助"gotchas 飞轮"和跨模型评估套件进行操作。Perplexity 特别强调,每个 Skill 都会对全局上下文构成成本,新增 Skill 可能无意间干扰已有 Skill 的正确路由。

相关链接:


Nous Research 宣布 Hermes Agent 登顶 OpenRouter 应用用量榜 #6

Nous Research 团队宣布,旗下Hermes AgentOpenRouter平台全球 Token 排名中超越OpenClaw登顶,拿下所有 AI 应用第一名。

Nous Research通过官方社交账号宣布,其旗下 Hermes Agent 已攀升至 OpenRouter 平台的全球 token 排名首位。

据该团队成员 Teknium 进一步表示,这意味着 Hermes Agent 在该平台所有 AI 应用中排名全球第一。

团队借此向近 1000 名贡献者、支持者及用户表达感谢。

同时,Teknium 向社区公开征询意见,询问用户对后续新功能或发展方向的期待。

相关链接:


消息称 Anthropic 与 Akamai 签署 18 亿美元七年合同 #7

据报道,Anthropic与云服务商Akamai签署了价值十八亿美元、为期七年云基础设施服务合同,以满足其日益增长的算力需求。受此大单提振,Akamai股价连续大涨。

据知情人士透露,人工智能公司Anthropic已与云服务提供商Akamai Technologies签署一项总额18亿美元、为期七年的计算服务合同,旨在满足其AI软件日益增长的需求。

Akamai在本周四发布2026年第一季度财报时披露,一家“领先的前沿模型提供商”已向其CIS(云基础设施服务)承诺18亿美元为期七年的采购额,但未指名合作方。

随后有媒体报道指该客户为Anthropic,而双方均未予置评。

相关链接:


报道称字节跳动今年 AI 基建支出超两千亿 #8

据报道,字节跳动今年AI基础设施支出将超2000亿元,较原计划至少增加25%,更多预算投向国产AI芯片。

近日,据《南华早报》援引知情人士报道,字节跳动今年在 AI 基础设施方面的支出将超过2000亿元人民币。

这一数字较去年底的1600亿元计划至少增加25%。增资原因包括AI 投入加大和存储芯片成本上涨。且更大比例的预算将分配给国产 AI 芯片

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误