AI 早报 2026-02-18

视频版YouTube哔哩哔哩

概览

精选

  • Anthropic 发布 Claude Sonnet 4.6 #1
  • xAI 上线 Grok 4.20 测试版 #2
  • NotebookLM推出幻灯片Prompt修订与PPTX导出 #3

模型发布

  • 蚂蚁集团开源Ming-omni-tts音频生成模型 #4
  • Cohere Labs发布Tiny Aya多语言模型 #5
  • 字节跳动研究团队开源 BitDance 多模态模型 #6

开发生态

  • Cursor 发布 2.5 版本更新,推出插件市场 #7
  • OpenAI修复GPT-5.3-Codex请求重定向问题 #8
  • Cerebras下调部分免费层级的推理额度 #9
  • Intelligent Internet 开源多Agent协作系统 Common Ground Core #10

行业动态

  • Nerve加入OpenAI构建ChatGPT搜索 #11
  • 传 Moonshot AI 完成7亿美元融资 #12

Anthropic 发布 Claude Sonnet 4.6 #1

Anthropic 正式发布了 Claude Sonnet 4.6 模型。该模型在编程、长上下文推理及 Agent 规划能力上全面升级,并支持 100 万 token 上下文。同步推出的还有改进版网页搜索工具,在提升准确率的同时大幅降低了 Token 消耗。目前,Sonnet 4.6 已上线 API 及各类AI应用,价格与上一代保持一致,免费版用户现已可在Claude体验。

Anthropic 正式发布 Claude Sonnet 4.6,官方称其为迄今最强的 Sonnet 模型。该模型在编程、长上下文推理、Agent 规划、知识工作及设计等领域全面升级,并提供支持 100 万 token 的上下文窗口(Beta版)。价格维持每百万 token 输入 3 美元、输出 15 美元不变。

性能提升显著。在编程方面,根据 Claude Code 的早期测试,约 70% 的开发者更偏好 Sonnet 4.6 而非上代模型,59% 的用户选择它而非旗舰 Opus 4.5。用户反馈其在修改代码前能更有效阅读上下文,并减少“偷懒”行为。在计算机使用能力上,OSWorld 基准测试得分从 14.0% 大幅提升至 72.5%,能更有效地处理复杂电子表格和多步网页表单任务。据外部评估,Sonnet 4.6 在部分真实工作任务基准上略微优于 Opus 4.6

Anthropic 同步推出改进版 Web SearchWeb Fetch 工具,通过 代码执行 对搜索结果进行动态过滤,官方数据显示平均准确率提升 11%,输入 Token 消耗减少 24%Sonnet 4.6 现已上线 API 及各类AI应用,免费版 Claude 也可体验Sonnet 4.6。官方建议,对于大规模代码重构等超复杂任务,Opus 4.6 仍是最佳选择,但对多数任务,Sonnet 4.6 提供了极高性价比。

相关链接:


xAI 上线 Grok 4.20 测试版 #2

xAI 上线了 Grok 4.20 公开测试版,该版本引入了由四个 Agent 组成的 原生协作系统,用于处理复杂查询。据 Elon Musk 称,该版本基于 5000 亿参数的 V8 模型,凭借快速学习与每周迭代,下个月测试结束时,其智能水平和速度预计将比 Grok 4 提升约一个数量级。

xAI上线了Grok 4.20公开测试版,用户需在应用内手动选择。据创始人Elon Musk透露,该模型并非单纯迭代,而是基于500B参数的V8小型基础模型构建。官方声明指出,Grok 4.2基础设施支持快速学习与每周更新,以实现“递归智能增长”。官方预计,在下个月测试版结束时,其智能水平和速度将比Grok 4提升约一个数量级。

该版本引入的原生多Agent协作系统是其核心亮点。据了解,该系统包含Grok/CaptainHarperBenjaminLucas 四个 Agent,在处理复杂查询时自动运行。

相关链接:


NotebookLM推出幻灯片Prompt修订与PPTX导出 #3

NotebookLM 发布重要更新,现在可以直接输入提示词来微调和修改幻灯片内容。同时,系统新增了 PPTX 导出支持,允许用户将生成的演示文稿直接下载为 PPTX 文件。这两项功能目前正在向 UltraPro 会员推送。

NotebookLM 发布两项重要更新:Prompt-Based RevisionsPPTX Support,以回应用户强烈需求。

核心功能 Prompt-Based Revisions 允许用户通过 Prompt 描述直接对幻灯片进行调整、定制和微调。此外,NotebookLM 现已支持将生成的幻灯片导出为 PPTX 格式,官方透露 Google Slides 的支持即将推出。NotebookLM 正为 UltraPro 会员推送这两项新功能:

相关链接:


蚂蚁集团开源Ming-omni-tts音频生成模型 #4

蚂蚁集团 Inclusion AI 开源了统一音频生成模型 Ming-Omni-TTS。该模型不仅能生成语音,还能合成音乐和环境音,包含 0.5B16.8B-A3B 两个版本。

蚂蚁集团 inclusionAI 开源统一音频生成模型 Ming-omni-tts,提供 0.5B16.8B-A3B 两个版本。该模型是业界首个在单通道内联合生成语音、环境音和音乐的 自回归模型,通过定制 12.5Hz 连续 Tokenizer 实现了 3.1Hz 的高效推理帧率。官方评测显示,Ming-omni-tts-16.8B-A3B 在粤语生成、情感控制及零样本语音克隆等基准测试中达到 SOTA 水平,其文本规范化能力媲美 Gemini-2.5 Pro。模型权重及推理代码已上线 Hugging FaceModelScopeGitHub

相关链接:


Cohere Labs发布Tiny Aya多语言模型 #5

Cohere Labs 发布了名为 Tiny Aya 的多语言小型模型家族。该系列拥有 33.5 亿 参数,覆盖全球 70 多种 语言。

Cohere Labs 发布多语言小型模型家族 Tiny Aya。该系列包含 3.35B 参数基座模型及 4 个针对全球及特定区域(南亚、西亚/非洲、欧亚)优化的指令微调模型,覆盖 70+ 种语言,侧重低资源语言支持。模型上下文 8K,采用 CC-BY-NC 协议,支持在笔记本电脑及手机端离线运行。官方指出模型擅长翻译与摘要,但在思维链推理任务上表现较弱。目前模型已在 Hugging FaceKaggle 等平台开源,提供 GGUF 格式。

相关链接:


字节跳动研究团队开源 BitDance 多模态模型 #6

字节跳动研究团队发布了名为 BitDance 的开源多模态模型,参数量达 140 亿,该模型专为视觉生成优化,通过 并行预测 Token,推理速度比标准模型提升超过 30 倍

字节跳动研究团队近日发布开源离散自回归多模态模型 BitDance,参数量为 14B。模型引入大词汇量二元分词器下一块扩散范式,支持每步并行预测最多 64Token,官方数据显示其比标准 AR 模型推理速度快 30 倍以上。

官方发布了 BitDance-14B-64x16x 两个版本,配套 UniWeTok 分词器。在性能方面,BitDanceDPG-Bench88.28 分)和 GenEval0.86 分)上表现优异。目前,该模型代码与权重已在 GitHubHugging Face 开源(Apache 2.0),并提供在线演示,相关论文已发布于 arXiv

相关链接:


Cursor 发布 2.5 版本更新,推出插件市场 #7

Cursor 发布了 2.5 版本更新,上线了 Cursor Marketplace 插件市场。首批整合了 FigmaStripeAWS 等工具。此外,子智能体现在支持异步运行树状协作沙箱功能新增了细粒度访问控制

近日,代码编辑器 Cursor 正式发布 2.5 版本,上线了 Cursor Marketplace 插件市场,并对核心 Agent 功能与 沙盒 安全机制进行了升级。

在扩展性方面,新版本引入统一插件机制,将 SkillsSubagentsMCP servers 等能力打包。Cursor Marketplace 已汇集 LinearFigmaStripeAWS 等首批合作伙伴插件,覆盖设计、支付、部署及数据分析全流程。用户可通过网页或编辑器内 /add-plugin 命令直接安装。官方已开放插件提交入口,并发布了其内部 CI代码审查 工作流模板 Cursor Team Kit,未来将推出支持统一治理的私有团队插件市场。

Agent 性能方面,子智能体 现已支持异步运行与树状层级协作,使父智能体可在后台执行任务,以更低的延迟处理大型重构或多文件任务。基于此,官方推出了具备自主规划与执行能力的 长期运行智能体,官方称在测试中已能生成更完整的 PR 并减少后续干预。

在安全与权限控制方面,沙盒 新增了对域名和本地文件系统的细粒度访问控制,提供 仅用户配置用户配置+默认值允许全部 三种模式。企业版管理员可通过 管理控制台 强制实施网络策略,确保组织级的出站访问安全。

相关链接:


OpenAI修复GPT-5.3-Codex请求重定向问题 #8

针对部分用户使用 GPT-5.3-Codex 却被路由至 GPT-5.2 的问题,OpenAI 称已修复相关 Bug 并校准了 分类器,同时在 CLI v0.102.0 版本中加入了显眼的降级通知功能。

OpenAIGPT-5.3-Codex 定义为其 Preparedness Framework 下的首个**“高网络安全能力”**模型。鉴于网络能力具备支持防御性研究与潜在恶意滥用的双重用途属性,OpenAI 实施了包括安全训练自动监控在内的多重防护措施,会将检测到的可疑网络活动流量 重路由至网络能力较弱的 GPT-5.2 模型。

针对近期用户遭遇请求被意外降级的情况,OpenAI 团队成员承认,系统曾在特定时段出现过度标记问题,影响了约 9% 的用户。该问题已修复,团队通过校准分类器将预期受影响用户比例降至 1% 以下,并修复了信任访问权限未生效的 Bug。为提升透明度,CLI v0.102.0 版本已加入请求被降级时的显眼通知,并将在未来几天内扩展至所有客户端。

相关链接:


Cerebras下调部分免费层级的推理额度 #9

Cerebras 官方宣布,由于部分模型需求量激增,已暂时下调相关模型免费层级的 速率限制

Cerebras官方宣布,因zai-glm-4.7qwen-3-235b-a22b-instruct-2507模型需求激增,已暂时下调免费层级速率限制,正致力恢复原有设置。

相关链接:


Intelligent Internet 开源多Agent协作系统 Common Ground Core #10

Intelligent Internet 宣布开源 多 Agent 协作操作系统 Common Ground Core,这是一个协议优先的 OS 内核,旨在解决 多 Agent 系统 常见的上下文丢失等问题。

Intelligent Internet 团队近日开源 多 Agent 协作操作系统 Common Ground Core (CGC)。该系统定位为 协议优先的 OS 内核,旨在解决 多 Agent 扩展时的 上下文丢失死锁协调崩溃 等问题。CGC 采用 边缘自由、内核约束 设计,利用 Postgres 维护 不可变共享认知账本 作为 真理源,通过 NATS 消除 分布式消息重排序风险。系统将人类视为与 AI 平等的 异步节点,支持介入协作。目前项目已在 GitHub 发布 预览版,提供 Docker 部署并集成 CardBox 状态模型。官方特别提示,当前版本 API 无认证且具备 任意命令执行能力,严禁直接暴露于 公网

相关链接:


Nerve加入OpenAI构建ChatGPT搜索 #11

初创公司 Nerve 宣布加入 OpenAI,团队将致力于在更大规模上为 ChatGPT 构建搜索功能。

企业级 AI Agent 初创公司 Nerve 官方宣布加入 OpenAI,旨在为 ChatGPT 构建更大规模的搜索功能。Nerve 过去 两年 专注于以搜索为核心的企业级 Agent,因认可 OpenAI信息检索 领域的深度与雄心而决定加入。针对现有客户,Nerve 宣布产品将在 30 天后 正式关停,即日起暂停所有计费;未来 30 天内 服务将继续运行并提供支持,过渡期结束后将安全删除所有客户数据。

相关链接:


传 Moonshot AI 完成7亿美元融资 #12

据媒体报道,月之暗面完成7亿美元融资,阿里巴巴腾讯参与投资,公司投后估值超过100亿美元

据媒体报道,Moonshot AI(月之暗面)完成7亿美元融资,投后估值超100亿美元。本轮融资由AlibabaTencent参与。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误

作者橘鸦Juya,视频版在同名哔哩哔哩。欢迎点赞、关注、分享