AI 早报 2026-02-20

视频版YouTube哔哩哔哩

概览

精选

  • Google发布Gemini 3.1 Pro Preview #1
  • Anthropic 明确禁止 Claude 订阅接入第三方 #2
  • Anthropic发布Claude API自动缓存 #3

模型发布

  • Zyphra发布首个大脑数据基础模型ZUNA #4
  • Jina AI发布jina-embeddings-v5-text #5

开发生态

  • Google Jules新增CI修复与提交署名 #6
  • Hugging Face推出Coding Agent 免费微调模型功能 #7
  • OpenRouter上线模型 Benchmarks 页面 #8
  • Cline CLI npm包遭遇供应链攻击 #9

产品应用

  • OpenAI优化ChatGPT交互式代码块 #10
  • Anthropic 向 Pro 用户开放 Claude in PowerPoint #11
  • 网易有道开源个人助理Agent LobsterAI #12
  • Google Labs发布Pomelli影棚级产品照功能 #13
  • NotebookLM发布幻灯片修订及PPTX导出 #14
  • YouTube扩展对话式AI至电视平台 #15

行业动态

  • OpenAI向AI对齐研究基金捐赠 750 万美元 #16
  • OpenAI联手塔塔集团布局印度市场 #17
  • 传Ineffable寻求十亿美元种子轮融资 #18

技术与洞察

  • Anthropic发布关于AI Agent自主性的实证研究报告 #19
  • 强化学习奠基人Sutton提出经验时代论 #20

前瞻与传闻

  • 传OpenAI正开发ChatGPT成人模式 #21

Google发布Gemini 3.1 Pro Preview #1

Google 发布了 Gemini 3.1 Pro Preview,该模型强化了推理能力,显著增强了代码生成能力Agent 工具调用的稳定性。新版本API新增medium思考模式。目前该模型已通过 Gemini AppAI StudioAntigravity 等渠道开放。定价与前代保持一致。

Google发布Gemini 3.1 Pro Preview,这是其3 Pro系列的首个更新,距前代发布约三个月。该Preview版本面向开发者、企业与消费者,重点提升了推理能力软件工程可靠性Agent任务稳定性

ARC-AGI-2基准测试中,该模型得分达77.1%,较前代Gemini 3 Pro31.1%实现翻倍以上增长。在其它专业评测中,该模型在GPQA Diamond科学知识测试中得分超94%SWE-Bench Verified代码修复任务得分达80.6%APEX-Agents长链任务得分从18.4%提升至33.5%

技术参数方面,模型维持100万token的上下文处理能力,并将API文件上传限制从20MB提升至100MB。模型还引入了medium思考等级,并推出专属端点以优化混合工具调用的可靠性。

定价与Gemini 3 Pro保持一致,该模型已通过Google AI AppNotebookLMAI StudioVertex AI等开发者工具开放,并登陆了多家第三方平台。

相关链接:


Anthropic 明确禁止 Claude 订阅接入第三方 #2

Anthropic 更新了 Claude Code 的使用条款,明确禁止将 FreeProMax 计划的 OAuth Token 用于任何第三方工具或 Agent SDK

Anthropic近期更新了Claude Code的法律与合规文档,重点明确了认证机制的使用范围与限制。官方规定,通过Free、Pro和Max订阅计划获取的OAuth Token仅限用于Claude CodeClaude.ai,严禁将其用于包括Agent SDK在内的任何第三方产品、工具或服务,否则将被视为违反消费者服务条款。官方要求,构建产品或服务的开发者必须通过Claude Console或受支持的云提供商使用API Key进行认证,并保留在无事先通知的情况下采取强制执行措施的权利。

相关链接:


Anthropic发布Claude API自动缓存 #3

AnthropicClaude API上线了自动提示词缓存功能,开发者只需设置一个cache_control参数, 系统即可自动缓存系统指令和历史记录等上下文。

Anthropic 近期为 Claude API 引入自动 Prompt Caching(提示词缓存)功能,旨在通过复用计算结果降低多轮对话的延迟与成本。开发者只需在 API 请求中设置单个 cache_control 参数,系统便会自动缓存该参数之前的上下文,如系统指令、工具描述等。

相关链接:


Zyphra发布首个大脑数据基础模型ZUNA #4

Zyphra 正式发布了首个基于大脑数据训练的基础模型 ZUNA。这是一个拥有 3.8 亿 参数的 掩码扩散自编码器,能够高效解决 头皮脑电图信号 的去噪与缺失通道重建问题。

Zyphra发布首个基于大脑数据训练的基础模型ZUNA,这是一个380M参数的掩码扩散自编码器,旨在对EEG信号进行去噪、缺失通道重建及上采样。该模型基于约200万通道小时的公开数据训练,据官方称,其重建精度显著优于广泛使用的MNE插值方法,尤其在通道丢失率超**75%**或高倍上采样场景下优势明显。

技术上,ZUNA通过将连续信号压缩为Token并引入4-D RoPE位置嵌入,实现了对异构EEG数据的高效处理。目前,该模型已采用Apache 2.0协议开源,支持消费级GPU运行。官方强调ZUNA仅供研究使用,尚未验证医疗功效,并计划在未来开源相关数据及基础设施。

相关链接:


Jina AI发布jina-embeddings-v5-text #5

Jina AI 发布并开源了文本嵌入模型 jina-embeddings-v5-text,包含 SmallNano 两个版本。

Jina AI 发布第五代文本嵌入模型系列 jina-embeddings-v5-text,包含 6.77 亿参数的 small2.39 亿参数的 nano 两个版本。官方称,该系列结合模型蒸馏与任务特定 LoRA 适配器技术,实现了同级最优性能。其中,small 模型在 MMTEB 基准得分 67.0,支持 32K 上下文及 119 种语言;nano 模型则专为边缘部署优化,支持 8K 上下文。两款模型均支持 Matryoshka 嵌入截断与二进制量化,权重已依据 CC BY-NC 4.0 协议在 Hugging Face 公开,并提供 APIGGUFMLX 等多种部署方式。此外,官方透露正开发多模态版本。

相关链接:


Google Jules新增CI修复与提交署名 #6

Google 旗下 AI Agent Jules 发布更新,新增 CI Fixer 自动修复功能。

Google 旗下 AI Agent Jules 发布更新,新增 CI Fixer 自动修复功能及可配置的提交作者身份。据官方更新日志,CI Fixer 可自动检测并修复 Jules 所创建 PRGitHub Actions 的失败检查,无需人工干预即可完成错误接收、修正及重新提交。同时,新增的 Commit Authoring 设置提供“Jules”、“Co-authored”及“User only”三种模式。该用户级设置适用于所有仓库,解决了此前因 Jules 独占署名导致用户 GitHub GitHub 贡献图 无法体现实际工作的问题。

相关链接:


Hugging Face推出Coding Agent 免费微调模型功能 #7

Hugging FaceUnsloth 合作推出了基于 Coding Agent 的免费模型微调服务,用户可通过验证领取免费 GPU 额度及 Pro 订阅。

Hugging Face 联合 Unsloth 推出通过 Coding Agent 免费微调模型的新功能。官方目前向加入“Unsloth Jobs Explorers”组织并验证账单的用户提供 免费 GPU 额度及 一个月 Pro 订阅。该方案利用 Unsloth2 倍速度提升和 60% 显存 优化,重点支持 1GB 内存 以下的小型模型。核心亮点在于支持 Claude CodeCodex 根据自然语言指令自动生成 脚本、提交 云端任务 及监控进度。据 Unsloth 创始人透露,该合作还支持 强化学习,旨在通过全托管 云端环境 实现无基础设施设置的快速迭代。

相关链接:


OpenRouter上线模型 Benchmarks 页面 #8

OpenRouter 正式上线 Benchmarks 页面,直观展示模型在 编程数学长上下文推理 等维度的行业标准测试表现。

OpenRouter 宣布正式上线 Benchmarks 页面,展示模型在编程、数学、科学及长上下文推理等维度的行业标准表现,并计划未来扩展测试项目。与此同时,Rankings 页面迎来更新,新增 Intelligence、Coding 和 Agentic Index scores 排行榜,支持模型变体对比,旨在优化模型筛选体验。

相关链接:


Cline CLI npm包遭遇供应链攻击 #9

Cline CLI 官方确认遭遇 供应链攻击,攻击者利用被盗的 npm 令牌 发布了恶意版本 cline@2.3.0

据官方安全公告与Endor Labs报告确认,Cline CLInpm注册表遭遇供应链攻击。未授权方利用被盗用的发布令牌,发布了恶意版本 cline@2.3.0。该版本通过篡改 postinstall 脚本,在用户机器上全局静默安装名为OpenClaw的程序。

相关链接:


OpenAI优化ChatGPT交互式代码块 #10

OpenAI 升级了 ChatGPT代码块功能,实现了编写、编辑与预览的一体化交互。

OpenAI 优化了 ChatGPTCode Blocks 功能,将代码编写、编辑与预览集成于同一交互组件。用户现可在对话流程中直接构建并实时预览微型应用与图表,改变了以往静态显示模式。此次更新加强了对流程图和 Mermaid 图表 的原生支持,并新增 代码调试 功能。同时,引入的 分屏全屏视图 优化了审查体验。该功能作为原生 UI 的一部分,旨在简化从构思到实现的转换过程。

相关链接:


Anthropic 向 Pro 用户开放 Claude in PowerPoint #11

Anthropic 宣布,Claude in PowerPoint 功能现已支持 Pro 计划,该功能可实现演示文稿的高效自动化生成。

Anthropic 官方宣布,Claude in PowerPoint 现已支持 Pro 计划,此前该功能已向 MaxTeamEnterprise 客户开放。该集成允许 ClaudePowerPoint 中实时构建、编辑幻灯片,并严格遵循 Slide Master品牌指南

主要功能包括:支持基于企业模板或从零开始生成完整草稿;能在保留原有格式的前提下进行精准修改,并将项目符号转化为可编辑的原生图表;此外,该功能现已支持 connectors,可将日常工具中的上下文直接引入幻灯片,并在现有 合规框架 内工作。

相关链接:


网易有道开源个人助理Agent LobsterAI #12

网易有道GitHub 开源了全场景个人助理项目 LobsterAI

网易有道GitHub 开源全场景个人助理项目 LobsterAI。该工具基于 Claude Agent SDK,通过 Cowork 模式实现 7×24 小时自主办公。它支持本地或 Alpine Linux 沙箱环境,内置 16 种技能涵盖数据分析、PPT 制作及 Playwright 自动化等,且具备记忆提取与定时任务能力。LobsterAI 兼容 macOSWindowsLinux,支持通过 钉钉飞书 等 IM 远程触发,数据本地 SQLite 存储,现已在 GitHub 提供源码及安装包。

相关链接:


Google Labs发布Pomelli影棚级产品照功能 #13

Google Labs免费营销工具Pomelli推出了Photoshoot功能,仅凭一张产品图就能自动生成符合品牌调性的专业级影棚照。目前已在美加澳新免费开放。

Google Labs 官方宣布为其免费营销工具 Pomelli 推出Photoshoot功能,旨在利用Business DNANano Banana技术,协助中小企业及个人用户通过四步操作将单张产品图转化为符合品牌调性的专业级影棚照。用户仅需上传图片、选择模板、生成并微调,即可获得高质量图像。除核心功能外,Pomelli 还同步升级了图像生成模型,提升了准确性;新增了图像编辑及风格参考功能;在营销活动创建上,支持基于 URL 的上下文生成。目前该工具已在美国、加拿大、澳大利亚和新西兰免费开放。

相关链接:


NotebookLM发布幻灯片修订及PPTX导出 #14

NotebookLM现已向所有用户开放PPTX导出权限,免费用户也即将上线基于提示词的幻灯片调整功能。

**NotebookLM**官方宣布Slide Revisions功能已向所有付费用户推出,免费用户即将获支持;PPTX导出功能现已面向**100%**用户开放。此次核心更新Prompt-Based Revisions允许通过提示词微调幻灯片。

相关链接:


YouTube扩展对话式AI至电视平台 #15

YouTube 已将 对话式 AI 工具 扩展至智能电视及流媒体设备,允许成年用户在不中断视频观看的情况下实时提问并获得解答。

YouTube 宣布将其 对话式 AI 工具 作为实验性功能扩展至 智能电视游戏主机流媒体设备。该功能允许部分 18 岁以上选定用户,通过 遥控器麦克风 或“Ask”按钮,在不中断视频播放的情况下提问并获得即时解答,目前支持英语等 五种 语言。

相关链接:


OpenAI向AI对齐研究基金捐赠 750 万美元 #16

OpenAI 宣布向 英国 AI 安全研究所 设立的独立研究基金 The Alignment Project 捐赠 750 万美元,以支持全球范围内的 AI 对齐AI 安全 研究。

OpenAI宣布向由英国AI安全研究所(UK AISI)创建的独立基金The Alignment Project捐赠750万美元(约560万英镑)。该基金总额超2700万英镑,由Renaissance Philanthropy协助管理,重点资助计算复杂性博弈论等领域的全球独立研究以缓解AI风险。单个项目资助额度通常在5万100万英镑之间。OpenAI强调,此次注资旨在增加当前轮次已通过审查的高质量项目数量,而非干预现有流程,以支持与内部前沿研究互补的外部独立生态,确保AGI的安全性。

相关链接:


OpenAI联手塔塔集团布局印度市场 #17

OpenAI与印度Tata集团达成战略合作,成为其数据中心的客户,首批锁定100MW容量并计划扩展至1GW,而Tata集团将在内部部署ChatGPT Enterprise

据媒体报道,OpenAI与印度Tata Group达成战略合作。OpenAI将成为TCS旗下HyperVault数据中心业务的首个客户,初步锁定100MW容量并计划扩展至1GW,以满足印度数据驻留低延迟需求。双方还将在Tata集团内部署ChatGPT Enterprise覆盖数十万员工,并利用Codex工具标准化软件开发。此外,OpenAI计划今年晚些时候在孟买和班加罗尔设立新办事处,并将扩展认证项目,TCS将成为美国以外首个参与该项目的组织。据官方引用CEO Sam Altman估算,印度目前拥有超1亿ChatGPT周活跃用户。

相关链接:


传Ineffable寻求十亿美元种子轮融资 #18

据报道,AlphaGo核心贡献者David Silver创立的Ineffable Intelligence正在筹集约10亿美元种子轮融资红杉资本领投,投前估值高达40亿美元

金融时报报道,AlphaGo核心贡献者、前Google DeepMind资深研究员David Silver正在为伦敦初创公司Ineffable Intelligence筹集约10亿美元种子轮融资,由红杉资本领投,投前估值约40亿美元。若交易完成,这将创下欧洲史上最大种子轮融资纪录。据悉,英伟达Google微软也正参与谈判。

该公司致力于构建“无尽学习的超级智能”,其技术路径不同于主流LLM,而是基于Silver在强化学习领域的积累,利用世界模型在模拟环境中通过试错和自主经验持续进化。

相关链接:


Anthropic发布关于AI Agent自主性的实证研究报告 #19

Anthropic发布关于AI Agent自主性的实证研究报告,报告指出,用户信任积累使Agent单次自主运行时长已增长至45分钟以上。

Anthropic发布**《Measuring AI agent autonomy in practice》报告显示,Agent自主性取得显著进展。过去三个月内,Claude Code单次免干预最长运行时间从不到25分钟增至超过45分钟**,主要归因于用户信任度提升。在监督模式上,资深开发者相比新手更倾向全自动批准(超40% vs 20%),但主动打断频率也更高(9% vs 5%),体现了“充分放权但保持敏锐监控”的策略。此外,Agent在复杂任务中主动求助次数是人类打断次数的两倍多,确立了关键的安全机制。目前近半数Agent操作集中在软件工程低风险领域,医疗、金融等高危行业虽已探索,但距离规模化部署尚有距离。

相关链接:


强化学习奠基人Sutton提出经验时代论 #20

图灵奖得主理查德·萨顿发表**《AI 的未来》**演讲,指出当前依赖人类数据的大模型仅是缺乏理解的弱心智,且正面临数据枯竭的天花板。让智能体通过与真实环境交互产生的数据流进行持续学习,是实现超级智能的必由之路。

图灵奖得主、强化学习奠基人Richard Sutton近日在洛杉矶加州大学纯粹与应用数学研究所(IPAM)发表了题为《AI的未来》的演讲。Sutton直指当前基于人类数据训练的大模型仅为“弱心智”,虽拥有海量知识但缺乏理解与真值判断能力。他称这种智能的本质是“理解太少、调参太多”,并认为AI正面临人类高质量数据枯竭的天花板。

Sutton提出,AI的未来属于“经验时代”。其核心是让AI Agent通过与环境的交互,从持续的经验流中学习,而非依赖静态的人类数据集。他指出,经验数据能随Agent能力提升而增长,这是实现突破、创造新知识的必由之路。他将过去十年划分为模拟时代人类数据时代,以及正在开启的经验时代

在政治与哲学层面,Sutton呼吁抵制对AI的集中控制,主张去中心化合作。他进一步提出宏大的宇宙演化视角,认为宇宙正进入“设计时代”,人类作为“复制者”的极限,其使命是创造具有设计能力的心智——即AI。因此,人类在这一进程中扮演着催化剂与先驱的角色,而资源与权力最终将流向更具智能的存在。

相关链接:


传OpenAI正开发ChatGPT成人模式 #21

有用户在ChatGPT网页代码中发现,OpenAI疑似正在开发代号为Citron Mode的成人模式。

据媒体报道,OpenAI 正在为 ChatGPT 开发 成人模式。开发者 Tibor Blaho 在其 网页代码 中发现了内部代号为 Citron Mode 的设置,据推测即为此功能。该模式引入 敏感内容警告机制,当用户分享被标记为 citron-only 的对话时,系统将显示警告,提示接收者可能需要验证年满 18岁 才能查看内容。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误

作者橘鸦Juya,视频版在同名哔哩哔哩。欢迎点赞、关注、分享