2026-02-18

AI 早报 2026-02-18
概览
精选
- Anthropic 发布 Claude Sonnet 4.6
#1 - xAI 上线 Grok 4.20 测试版
#2 - NotebookLM推出幻灯片Prompt修订与PPTX导出
#3
模型发布
- 蚂蚁集团开源Ming-omni-tts音频生成模型
#4 - Cohere Labs发布Tiny Aya多语言模型
#5 - 字节跳动研究团队开源 BitDance 多模态模型
#6
开发生态
- Cursor 发布 2.5 版本更新,推出插件市场
#7 - OpenAI修复GPT-5.3-Codex请求重定向问题
#8 - Cerebras下调部分免费层级的推理额度
#9 - Intelligent Internet 开源多Agent协作系统 Common Ground Core
#10
行业动态
- Nerve加入OpenAI构建ChatGPT搜索
#11 - 传 Moonshot AI 完成7亿美元融资
#12
Anthropic 发布 Claude Sonnet 4.6 #1
Anthropic 正式发布了
Claude Sonnet 4.6模型。该模型在编程、长上下文推理及Agent规划能力上全面升级,并支持 100 万token上下文。同步推出的还有改进版网页搜索工具,在提升准确率的同时大幅降低了Token消耗。目前,Sonnet 4.6已上线API及各类AI应用,价格与上一代保持一致,免费版用户现已可在Claude体验。
Anthropic 正式发布 Claude Sonnet 4.6,官方称其为迄今最强的 Sonnet 模型。该模型在编程、长上下文推理、Agent 规划、知识工作及设计等领域全面升级,并提供支持 100 万 token 的上下文窗口(Beta版)。价格维持每百万 token 输入 3 美元、输出 15 美元不变。
性能提升显著。在编程方面,根据 Claude Code 的早期测试,约 70% 的开发者更偏好 Sonnet 4.6 而非上代模型,59% 的用户选择它而非旗舰 Opus 4.5。用户反馈其在修改代码前能更有效阅读上下文,并减少“偷懒”行为。在计算机使用能力上,OSWorld 基准测试得分从 14.0% 大幅提升至 72.5%,能更有效地处理复杂电子表格和多步网页表单任务。据外部评估,Sonnet 4.6 在部分真实工作任务基准上略微优于 Opus 4.6。
Anthropic 同步推出改进版 Web Search 和 Web Fetch 工具,通过 代码执行 对搜索结果进行动态过滤,官方数据显示平均准确率提升 11%,输入 Token 消耗减少 24%。Sonnet 4.6 现已上线 API 及各类AI应用,免费版 Claude 也可体验Sonnet 4.6。官方建议,对于大规模代码重构等超复杂任务,Opus 4.6 仍是最佳选择,但对多数任务,Sonnet 4.6 提供了极高性价比。



相关链接:
- https://www.anthropic.com/news/claude-sonnet-4-6
- https://claude.com/blog/improved-web-search-with-dynamic-filtering
xAI 上线 Grok 4.20 测试版 #2
xAI 上线了
Grok 4.20公开测试版,该版本引入了由四个Agent组成的原生协作系统,用于处理复杂查询。据 Elon Musk 称,该版本基于 5000 亿参数的V8模型,凭借快速学习与每周迭代,下个月测试结束时,其智能水平和速度预计将比Grok 4提升约一个数量级。
xAI上线了Grok 4.20公开测试版,用户需在应用内手动选择。据创始人Elon Musk透露,该模型并非单纯迭代,而是基于500B参数的V8小型基础模型构建。官方声明指出,Grok 4.2基础设施支持快速学习与每周更新,以实现“递归智能增长”。官方预计,在下个月测试版结束时,其智能水平和速度将比Grok 4提升约一个数量级。
该版本引入的原生多Agent协作系统是其核心亮点。据了解,该系统包含Grok/Captain、Harper、Benjamin和Lucas 四个 Agent,在处理复杂查询时自动运行。




相关链接:
NotebookLM推出幻灯片Prompt修订与PPTX导出 #3
NotebookLM 发布重要更新,现在可以直接输入提示词来微调和修改幻灯片内容。同时,系统新增了
PPTX导出支持,允许用户将生成的演示文稿直接下载为PPTX文件。这两项功能目前正在向 Ultra 和 Pro 会员推送。
NotebookLM 发布两项重要更新:Prompt-Based Revisions 与 PPTX Support,以回应用户强烈需求。
核心功能 Prompt-Based Revisions 允许用户通过 Prompt 描述直接对幻灯片进行调整、定制和微调。此外,NotebookLM 现已支持将生成的幻灯片导出为 PPTX 格式,官方透露 Google Slides 的支持即将推出。NotebookLM 正为 Ultra 和 Pro 会员推送这两项新功能:

相关链接:
蚂蚁集团开源Ming-omni-tts音频生成模型 #4
蚂蚁集团
Inclusion AI开源了统一音频生成模型Ming-Omni-TTS。该模型不仅能生成语音,还能合成音乐和环境音,包含 0.5B 和 16.8B-A3B 两个版本。
蚂蚁集团 inclusionAI 开源统一音频生成模型 Ming-omni-tts,提供 0.5B 及 16.8B-A3B 两个版本。该模型是业界首个在单通道内联合生成语音、环境音和音乐的 自回归模型,通过定制 12.5Hz 连续 Tokenizer 实现了 3.1Hz 的高效推理帧率。官方评测显示,Ming-omni-tts-16.8B-A3B 在粤语生成、情感控制及零样本语音克隆等基准测试中达到 SOTA 水平,其文本规范化能力媲美 Gemini-2.5 Pro。模型权重及推理代码已上线 Hugging Face、ModelScope 及 GitHub。

相关链接:
- https://xqacmer.github.io/Ming-Flash-Omni-V2-TTS/
- https://github.com/inclusionAI/Ming-omni-tts
- https://modelscope.cn/studios/antsipan/ming-uniaudio-demo
Cohere Labs发布Tiny Aya多语言模型 #5
Cohere Labs 发布了名为
Tiny Aya的多语言小型模型家族。该系列拥有 33.5 亿 参数,覆盖全球 70 多种 语言。
Cohere Labs 发布多语言小型模型家族 Tiny Aya。该系列包含 3.35B 参数基座模型及 4 个针对全球及特定区域(南亚、西亚/非洲、欧亚)优化的指令微调模型,覆盖 70+ 种语言,侧重低资源语言支持。模型上下文 8K,采用 CC-BY-NC 协议,支持在笔记本电脑及手机端离线运行。官方指出模型擅长翻译与摘要,但在思维链推理任务上表现较弱。目前模型已在 Hugging Face、Kaggle 等平台开源,提供 GGUF 格式。

相关链接:
- https://cohere.com/blog/cohere-labs-tiny-aya
- https://github.com/Cohere-Labs/tiny-aya-tech-report/blob/main/tiny_aya_tech_report.pdf
- https://huggingface.co/collections/CohereLabs/tiny-aya
字节跳动研究团队开源 BitDance 多模态模型 #6
字节跳动研究团队发布了名为
BitDance的开源多模态模型,参数量达 140 亿,该模型专为视觉生成优化,通过并行预测 Token,推理速度比标准模型提升超过 30 倍。
字节跳动研究团队近日发布开源离散自回归多模态模型 BitDance,参数量为 14B。模型引入大词汇量二元分词器及下一块扩散范式,支持每步并行预测最多 64 个 Token,官方数据显示其比标准 AR 模型推理速度快 30 倍以上。
官方发布了 BitDance-14B-64x 和 16x 两个版本,配套 UniWeTok 分词器。在性能方面,BitDance 在 DPG-Bench(88.28 分)和 GenEval(0.86 分)上表现优异。目前,该模型代码与权重已在 GitHub 和 Hugging Face 开源(Apache 2.0),并提供在线演示,相关论文已发布于 arXiv。

相关链接:
- https://github.com/shallowdream204/BitDance
- https://bitdance.csuhan.com/
- https://huggingface.co/collections/shallowdream204/bitdance
Cursor 发布 2.5 版本更新,推出插件市场 #7
Cursor 发布了 2.5 版本更新,上线了 Cursor Marketplace 插件市场。首批整合了 Figma、Stripe 和 AWS 等工具。此外,
子智能体现在支持异步运行与树状协作,沙箱功能新增了细粒度访问控制。
近日,代码编辑器 Cursor 正式发布 2.5 版本,上线了 Cursor Marketplace 插件市场,并对核心 Agent 功能与 沙盒 安全机制进行了升级。
在扩展性方面,新版本引入统一插件机制,将 Skills、Subagents、MCP servers 等能力打包。Cursor Marketplace 已汇集 Linear、Figma、Stripe、AWS 等首批合作伙伴插件,覆盖设计、支付、部署及数据分析全流程。用户可通过网页或编辑器内 /add-plugin 命令直接安装。官方已开放插件提交入口,并发布了其内部 CI 和 代码审查 工作流模板 Cursor Team Kit,未来将推出支持统一治理的私有团队插件市场。
在 Agent 性能方面,子智能体 现已支持异步运行与树状层级协作,使父智能体可在后台执行任务,以更低的延迟处理大型重构或多文件任务。基于此,官方推出了具备自主规划与执行能力的 长期运行智能体,官方称在测试中已能生成更完整的 PR 并减少后续干预。
在安全与权限控制方面,沙盒 新增了对域名和本地文件系统的细粒度访问控制,提供 仅用户配置、用户配置+默认值 及 允许全部 三种模式。企业版管理员可通过 管理控制台 强制实施网络策略,确保组织级的出站访问安全。


相关链接:
OpenAI修复GPT-5.3-Codex请求重定向问题 #8
针对部分用户使用
GPT-5.3-Codex却被路由至GPT-5.2的问题,OpenAI 称已修复相关Bug并校准了分类器,同时在CLIv0.102.0 版本中加入了显眼的降级通知功能。
OpenAI 将 GPT-5.3-Codex 定义为其 Preparedness Framework 下的首个**“高网络安全能力”**模型。鉴于网络能力具备支持防御性研究与潜在恶意滥用的双重用途属性,OpenAI 实施了包括安全训练和自动监控在内的多重防护措施,会将检测到的可疑网络活动流量 重路由至网络能力较弱的 GPT-5.2 模型。
针对近期用户遭遇请求被意外降级的情况,OpenAI 团队成员承认,系统曾在特定时段出现过度标记问题,影响了约 9% 的用户。该问题已修复,团队通过校准分类器将预期受影响用户比例降至 1% 以下,并修复了信任访问权限未生效的 Bug。为提升透明度,CLI v0.102.0 版本已加入请求被降级时的显眼通知,并将在未来几天内扩展至所有客户端。

相关链接:
- https://developers.openai.com/codex/concepts/cyber-safety
- https://x.com/embirico/status/2023891414623592653
Cerebras下调部分免费层级的推理额度 #9
Cerebras 官方宣布,由于部分模型需求量激增,已暂时下调相关模型免费层级的
速率限制。
Cerebras官方宣布,因zai-glm-4.7和qwen-3-235b-a22b-instruct-2507模型需求激增,已暂时下调免费层级速率限制,正致力恢复原有设置。

相关链接:
Intelligent Internet 开源多Agent协作系统 Common Ground Core #10
Intelligent Internet 宣布开源
多 Agent协作操作系统Common Ground Core,这是一个协议优先的OS内核,旨在解决多 Agent 系统常见的上下文丢失等问题。
Intelligent Internet 团队近日开源 多 Agent 协作操作系统 Common Ground Core (CGC)。该系统定位为 协议优先的 OS 内核,旨在解决 多 Agent 扩展时的 上下文丢失、死锁 及 协调崩溃 等问题。CGC 采用 边缘自由、内核约束 设计,利用 Postgres 维护 不可变共享认知账本 作为 真理源,通过 NATS 消除 分布式消息重排序风险。系统将人类视为与 AI 平等的 异步节点,支持介入协作。目前项目已在 GitHub 发布 预览版,提供 Docker 部署并集成 CardBox 状态模型。官方特别提示,当前版本 API 无认证且具备 任意命令执行能力,严禁直接暴露于 公网。

相关链接:
- https://github.com/Intelligent-Internet/CommonGround
- https://ii.inc/web/blog/post/common-ground-core-cgc
Nerve加入OpenAI构建ChatGPT搜索 #11
初创公司 Nerve 宣布加入 OpenAI,团队将致力于在更大规模上为 ChatGPT 构建搜索功能。
企业级 AI Agent 初创公司 Nerve 官方宣布加入 OpenAI,旨在为 ChatGPT 构建更大规模的搜索功能。Nerve 过去 两年 专注于以搜索为核心的企业级 Agent,因认可 OpenAI 在 信息检索 领域的深度与雄心而决定加入。针对现有客户,Nerve 宣布产品将在 30 天后 正式关停,即日起暂停所有计费;未来 30 天内 服务将继续运行并提供支持,过渡期结束后将安全删除所有客户数据。

相关链接:
传 Moonshot AI 完成7亿美元融资 #12
据媒体报道,月之暗面完成7亿美元融资,阿里巴巴和腾讯参与投资,公司投后估值超过100亿美元。
据媒体报道,Moonshot AI(月之暗面)完成7亿美元融资,投后估值超100亿美元。本轮融资由Alibaba与Tencent参与。
相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。
作者橘鸦Juya,视频版在同名哔哩哔哩。欢迎点赞、关注、分享。