2026-02-27

AI 早报 2026-02-27
概览
要闻
模型发布
开发生态
- OpenAI推出Codex CLI 0.105.0更新 ↗
#7 - Figma与Codex合作打通双向设计代码工作流 ↗
#8 - Gemini CLI推出 v0.30.0更新 ↗
#9 - Cursor 正式发布 Bugbot Autofix ↗
#10 - Anthropic 推出开源开发者支持计划 ↗
#11
产品应用
- OpenAI为ChatGPT推出文件保存功能Library ↗
#12 - Claude免费用户获享Connectors功能 ↗
#13 - 微软推出Copilot Tasks研究预览版 ↗
#14 - Google Stitch官方上线Direct Edits功能 ↗
#15
技术与洞察
行业动态
- AMD投资25亿美元与Nutanix共建全栈AI平台 ↗
#18 - Intrinsic并入Google加速Physical AI发展 ↗
#19 - OpenAI接连挖走Meta两位核心技术高管 ↗
#20
前瞻与传闻
- DeepSeek据传正测试V4新模型并向华为授权
#21 - 亚马逊据传将向OpenAI投资高达500亿美元 ↗
#22 - 据传谷歌与Meta签署数十亿美元AI芯片协议 ↗
#23 - GPT-5.3被曝或已上线Arena ↗
#24 - 传Meta两款AI模型亮相测试平台 ↗
#25
Google发布Nano Banana 2图像生成模型 #1
Google正式发布图像生成模型Nano Banana 2,该模型结合了Pro版的高智能与Flash版的高速度,目前以1279分位列Image Arena榜首。它具备精准的文本渲染及多角色一致性生成能力,现已全面集成至Gemini应用、Google搜索及Vertex AI等产品中,并成为默认图像生成模型。开发者可立即通过API接入使用,其成本相比Pro版下降约50%。在Gemini应用中,Nano Banana 2接入了所有模型选项,付费订阅用户可以通过菜单重新生成图像,使用 Nano Banana Pro 进行生成。
Google正式发布最新图像生成与编辑模型Nano Banana 2(Gemini 3.1 Flash Image)。该模型融合了Nano Banana Pro的高级智能与Gemini Flash的处理速度,旨在兼顾高质量与高效率。它集成了Gemini的真实世界知识库,支持通过实时网络搜索优化生成结果。其核心升级包括更精准的文本渲染与翻译能力,以及显著提升的主体一致性,支持在单次生成中维持最多5个角色和14个物体的特征。
在性能表现上,据Arena.ai数据显示,Nano Banana 2以1279分在Image Arena排名中位列第一。官方基准测试也显示其大幅优于GPT-Image 1.5、Seedream 5.0 Lite等模型。
在可用性与定价方面,Nano Banana 2现已集成至Gemini App、Google搜索、Vertex AI等全线产品,同时,其API成本相比Pro版显著降低,其中1K图像价格降幅约为50%。在Gemini应用中,Nano Banana 2成为了所有选项的默认图像生成模型,付费订阅用户可以通过菜单重新生成图像,使用 Nano Banana Pro 进行生成。





相关链接:
- https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
- https://blog.google/innovation-and-ai/technology/developers-tools/build-with-nano-banana-2/
Claude Code推出跨会话记忆功能 #2
Claude Code 已全面推出 Auto memory 功能,允许模型跨会话自动记忆项目上下文和用户偏好,并通过
MEMORY.md文件实现持久化。该系统建立了包含组织、项目及用户级的层级化管理架构,用户可直接使用memory斜杠命令交互式管理记忆。
Claude Code现已全面推出Auto memory功能,旨在跨会话自动记忆项目上下文及用户偏好。该功能默认开启,通过在特定目录生成MEMORY.md作为Claude维护的持久化笔记,启动时自动加载前200行。系统构建了包含组织级、项目级、用户级及本地设置的分层记忆管理体系,并支持通过.claude/rules/目录及@path语法实现模块化规则配置。用户可利用/memory命令交互管理,或通过配置文件及环境变量精确控制功能启用状态。

相关链接:
Google Translate 正式接入 Genimi #3
Google Translate 正式接入
Gemini大模型,推出了“替代选项”、“Understand”和“Ask”三项新功能,旨在帮助用户在从日常闲聊到专业会议的各种场景中精准把握语气与语境。目前该功能已在美国和印度地区的移动端应用上线,即将支持网页版。
Google 官方宣布 Google Translate 引入由 Gemini 驱动的全新 AI 功能,旨在帮助用户在各类场景中精准把握语气与语境。此次更新新增三项核心功能:为习语和口语提供多样化表达变体的“替代选项”、展示翻译概览的“Understand”按钮,以及允许针对特定国家及方言进行交互式提问的“Ask”按钮。
目前,该新体验已在美国和印度地区的 Translate 应用(Android 和 iOS)上线,并即将支持 Web 端。

相关链接:
QuiverAI推出SVG AI模型Arrow 1.0 #4
QuiverAI发布了首款SVG AI模型
Arrow 1.0并开启公测,它能将文本或图像转化为高细节的矢量图,效果十分惊艳。该公司同步宣布完成了830万美元的种子轮融资,由a16z领投。
QuiverAI 宣布推出 Arrow 1.0 模型测试版,官方称其为“首款 SVG AI 模型”,支持从图像和文本输入生成 SVG,旨在将用户创意转化为图形。公司创始人 Joan Rodriguez 同时透露,这家专注于前沿矢量设计的公司已完成 830 万美元 种子轮融资,本轮融资由 a16z 领投。



相关链接:
Perplexity开源pplx-embed系列文本嵌入模型 #5
Perplexity发布并开源了基于
Qwen3的pplx-embed系列SOTA文本Embedding模型,包含针对独立文本和RAG上下文优化的两个版本。
Perplexity 正式发布了 pplx-embed 系列文本 Embedding 模型,旨在优化网络级检索任务。该系列包含针对独立文本优化的 pplx-embed-v1,以及专为RAG系统中上下文文档块设计的 pplx-embed-context-v1。两款模型均基于 Qwen3 架构并采用扩散预训练技术,提供 0.6B(1024维)和 4B(2560维)两种参数规格,支持 32K 上下文长度及MRL。据官方介绍,这些模型已在千万级文档的真实搜索场景中得到验证,并以MIT协议在Hugging Face开源。

相关链接:
- https://research.perplexity.ai/articles/pplx-embed-state-of-the-art-embedding-models-for-web-scale-retrieval
- https://huggingface.co/collections/perplexity-ai/pplx-embed
纽约大学Solaris团队开源多人游戏世界模型 #6
纽约大学团队发布了首个针对《我的世界》的多人视频世界模型
Solaris,它能基于共享全局状态,同时为两名玩家生成视角一致的第一人称视频。
纽约大学团队发布首个《我的世界》多人视频世界模型 Solaris,能基于全局状态生成双玩家视角一致的第一人称视频。发布包含自研数据引擎 SolarisEngine、基于 DiT 架构经 1260万帧 数据训练的模型及 Solaris Eval 评估基准。为解决长视野生成中的显存瓶颈,团队引入了“Checkpointed Self Forcing”技术。实验显示其在一致性与复杂任务上优于基线。项目已在 GitHub 和 Hugging Face 开源,代码基于 JAX 实现。推理需显存至少 48GB 的 GPU。

相关链接:
- https://github.com/solaris-wm/solaris
- https://solaris-wm.github.io/
- https://huggingface.co/nyu-visionx/solaris
OpenAI推出Codex CLI 0.105.0更新 #7
OpenAI 发布了
Codex CLI更新,重点升级了终端交互体验与多智能体协作能力。用户现在可以在终端内按住空格键直接进行语音指令输入,并能通过CSV文件批量生成子代理来执行大规模任务。此外,新版本还新增了代码语法高亮、实时主题切换以及更灵活的审批控制机制,显著提升了开发效率。
OpenAI 发布 Codex CLI 0.105.0 版本,重点优化终端界面、多代理工作流及系统稳定性。TUI 新增代码块与 diff 语法高亮、/theme 主题选择器及实验性语音听写功能;多代理工作流支持从 CSV 批量生成子代理并显示进度。新增 /copy 命令,改进审批控制与沙箱权限,修复 WebSocket、Linux 沙箱及 js_repl 等底层问题。部分社区用户将此称为 Codex 迄今最大更新,并讨论了子代理深度定制等能力。


相关链接:
Figma与Codex合作打通双向设计代码工作流 #8
Figma 宣布与 OpenAI Codex 深度集成,通过
Figma MCP server打通了设计画布与代码环境的双向工作流。
Figma 官方宣布,即日起通过 Figma MCP server 与 OpenAI Codex 深度集成,打通代码与设计画布的双向工作流。开发者现可在 Codex 桌面应用中利用 get_design_context 工具提取 Figma 文件的布局与样式信息生成代码;同时可通过 generate_figma_design 工具,将实时运行的应用界面自动转换为可编辑的 Figma Design 文件。此次集成实现了“代码-画布-代码”的完整闭环,支持设计变更无损同步回代码环境,用户可在 Codex 中直接安装该服务器以实现无缝迭代与协作。

相关链接:
- https://www.figma.com/blog/introducing-codex-to-figma/
- https://developers.openai.com/blog/building-frontend-uis-with-codex-and-figma
Gemini CLI推出 v0.30.0更新 #9
Gemini CLI 发布
v0.30.0版本,已向所有使用 Gemini 3 的用户推送最新的3.1 Pro模型。此次更新实现了跨平台及工作区外的文件拖拽上传等交互体验优化功能。
Gemini CLI 发布 v0.30.0 版本更新,核心模型升级至 Gemini 3.1 Pro,并将 Gemini 3 设为默认家族,预计未来几天向所有用户完成推送。此次更新优化了交互体验,支持跨平台及工作区外文件拖拽上传,增设权限确认,并为 Posix 用户提供了挂起与恢复功能,同时允许开启模型思考气泡完整模式。
生态扩展方面,新增 Neo4J 和 Atlassian MCP 扩展,支持自然语言查询与自动化。系统配置上,聊天会话默认保留期设为 30 天,实验性 Plan Mode 引入了 5 阶段顺序规划工作流。
相关链接:
Cursor 正式发布 Bugbot Autofix #10
Cursor 宣布正式向所有用户开放代码评审 Agent “Bugbot” 的 “Autofix” 功能。该功能可实现在
Pull Request中自动发现并修复问题的闭环。
Cursor 官方宣布,其代码评审 Agent “Bugbot” 的 “Bugbot Autofix” 功能已结束 beta 测试,正式向所有用户开放。该功能通过在独立虚拟机中启动云端 Agent 运行测试,实现了在 Pull Request 中自动发现并修复问题的闭环。
据官方数据,Bugbot 解决率已从 52% 提升至 76%,单次运行识别问题数量几乎翻倍,超 35% 的 Autofix 修改被合并。Cursor 团队未来将致力于实现自定义自动化工作流及持续代码库扫描。

相关链接:
Anthropic 推出开源开发者支持计划 #11
Anthropic 启动“Claude for Open Source”计划,向符合资格的开源项目维护者及核心贡献者提供为期6个月的免费Claude Max 20x使用权。名额上限为一万人。
Anthropic正式推出**“Claude for Open Source”计划,旨在支持开源社区。该计划向符合资格的项目维护者及核心贡献者提供为期6个月的免费Claude Max** 20x使用权。申请标准主要面向拥有5,000以上GitHub Stars或月NPM下载量超100万的公共仓库活跃维护者;维护关键生态依赖但未达标者亦可申请。名额上限为10,000人,官方将滚动审核并通过邮件发送激活链接。

相关链接:
- https://claude.com/contact-sales/claude-for-oss
- https://x.com/lydiahallie/status/2027129030571634721
OpenAI为ChatGPT推出文件保存功能Library #12
OpenAI 正在为 ChatGPT 推出“Library”功能,可自动保存用户上传的文档、表格和图像等文件,并支持在不同对话间复用。
OpenAI正在为 ChatGPT 推出“Library”功能,旨在自动保存用户上传的文档、图像等文件以便复用。用户可通过侧边栏或描述查找文件,并在新对话中通过“Add from library”选项添加。该功能支持手动管理,删除对话不连带删除文件,但不适用于 Temporary Chat 及 Health 模式。存储限制方面,通用文件上限 512MB,个人和组织用户分别享有 10GB 与 100GB 配额。

相关链接:
Claude免费用户获享Connectors功能 #13
Claude官方宣布,Connectors功能现已面向免费用户开放,可连接涵盖编程、设计及财务等领域的150多个第三方工具。
Claude官方宣布,Connectors功能现已正式向免费计划用户开放。该功能支持接入涵盖编程、数据、设计、财务及销售等多个领域的150多个工具,旨在实现Claude与外部工作环境的交互。具体应用包括起草Slack消息、生成Figma图表及管理Asana时间线。

相关链接:
微软推出Copilot Tasks研究预览版 #14
微软 Copilot 公布了新功能 Copilot Tasks,旨在推动 AI 从“对话”转向“执行”。用户无需编程,只需描述需求,系统即可自动处理任务。已开放候补名单。
微软 Copilot 公布了新功能 Copilot Tasks,旨在推动 AI 从“对话”转向“执行”,核心理念为“少说话、多做事”。用户无需复杂设置或编程技能,仅通过描述任务,Copilot 即可自动处理。官方列举了三大应用场景:能将教学大纲转化为含模拟考试的学习计划;每周追踪房源并预约看房;每晚筛选紧急邮件并起草回复,同时自动退订促销邮件。目前,可申请加入候补名单等待体验该功能。

相关链接:
Google Stitch官方上线Direct Edits功能 #15
Google设计工具 Stitch 正式上线 Direct Edits 功能,用户现可直接在工具内部手动修改文本或图片,也能选中组件提示
Gemini进行迭代更新,无需切换环境即可高效完成设计成品的最终润色。
Google 旗下设计工具 Stitch 官方宣布上线 “Direct Edits” 功能,旨在解决设计生成后的细节微调痛点。针对现有 “Vibe Design” 模式虽能快速探索创意但难以进行修正错别字或替换图片等细微操作的问题,新功能支持用户直接在 Stitch 内部手动编辑,或选中特定组件指示 Gemini 生成更新版本。这种结合手动微调与 AI 辅助的方式,实现了从创意生成到细节完善的高效闭环。

相关链接:
DeepSeek携手清北发布DualPath推理系统 #16
DeepSeek 联合清华、北大发布论文,介绍了
DualPath推理系统。该系统创新性地引入双路径 KV-Cache 加载机制,利用闲置的 Decode 引擎带宽,解决了 Agentic LLM 在多轮长上下文推理中的存储 I/O 瓶颈。在生产测试中,该系统吞吐量获得接近2倍的提升。
DeepSeek 联合清华大学与北京大学推出 DualPath 推理系统,旨在解决 Agentic LLM 多轮长上下文推理中的存储 I/O 瓶颈。该系统创新采用双路径 KV-Cache 加载机制,在保留传统存储路径的同时,利用闲置 Decode 引擎带宽经 RDMA 回传数据,并配合以网卡为中心的流量管理及全局动态调度策略。实验数据显示,在 DeepSeek-V3.2 等模型的生产负载测试中,DualPath 将离线推理吞吐量最高提升 1.87 倍,在线服务吞吐量平均提升 1.96 倍,且未违反 SLO,在千卡规模下具备近线性扩展能力。

相关链接:
Andrej Karpathy称AI编程Agent已实现颠覆性突破 #17
AI 专家 Andrej Karpathy 指出,自去年 12月 起,
Coding Agent的能力迎来拐点,已能自主解决复杂的长时任务,编程形态已发生根本改变,开发者需转向“Agentic Engineering”,将核心工作从代码执行转变为用英语管理Agent并验证结果。
AI专家 Andrej Karpathy 指出,自去年 12月 起,Coding Agent 因模型质量与韧性提升迎来拐点,已具备处理复杂长时任务的能力。他以实战为例,仅通过英语指令,Agent 在约 30分钟 内自主完成了部署 vLLM、测试 Qwen3-VL 及构建 Web UI 等任务,将原本需耗费整个周末的工作自动化。
Karpathy 强调,编程正从“键入代码”转变为“管理 Agent”,未来核心在于通过 Agentic Engineering 构建 Orchestrator 管理并行实例。尽管技术尚不完美,仍需人工指导,但开发者核心任务已从“执行”转向“验证”,理解能力无法被外包。
相关链接:
AMD投资25亿美元与Nutanix共建全栈AI平台 #18
AMD 与云计算公司 Nutanix 达成多年战略合作,AMD 将总计投入 2.5 亿美元,于今年第二季度完成对 Nutanix 的股权投资,结合双方软硬件优势共同打造支持智能体
AI的全栈式开放基础设施平台。
AMD与云计算公司Nutanix宣布达成多年战略合作,共同开发开放全栈AI基础设施平台。AMD将总计投资2.5亿美元,含以每股36.26美元收购1.5亿美元****Nutanix普通股(预计2026年Q2完成)及最高1亿美元研发推广资金。双方将整合AMD软硬件技术与Nutanix云平台,首批智能体AI平台预计2026年底上市。

相关链接:
Intrinsic并入Google加速Physical AI发展 #19
Alphabet 旗下的机器人软件子公司 Intrinsic 正式并入 Google,将依托
Gemini模型与 DeepMind 资源加速物理 AI 的发展。
Alphabet 旗下 Intrinsic 正式并入 Google,旨在利用其前沿 AI 资源加速 Physical AI(物理 AI)发展。Intrinsic 成立于 2021 年,致力于通过 Flowstate 平台降低工业机器人应用的开发门槛,执行如组装服务器、搬运 EV 电池等现实任务。
据媒体报道,Intrinsic 加入后将保持独立运营,并接入 Gemini 模型与 Google DeepMind 深度协作。其客户涵盖小型车间至 Foxconn 等巨头,计划于 2025 年底发布 Vision AI 模型。行业观察认为,此举是 Google 应对具身智能领域竞争的关键布局。

相关链接:
OpenAI接连挖走Meta两位核心技术高管 #20
OpenAI证实已从Meta超级智能实验室挖走两位核心大将,分别是前苹果基础模型负责人庞若鸣与
SAM 3模型主导者张鹏川。
OpenAI近期接连从Meta挖走两位核心华人AI研究员。据外媒报道,OpenAI证实前苹果AI负责人庞若鸣已于上周入职。庞若鸣于2025年7月以约2亿美元年薪加入Meta超级智能实验室负责基础设施。同时,Meta研究科学家张鹏川宣布将加入OpenAI,从事世界模型及机器人研究。张鹏川曾主导SAM 3及Llama视觉模块开发。两人均来自Meta 2025年7月成立的超级智能实验室,该实验室近期面临人才流失,另有多名高管离职。
相关链接:
DeepSeek据传正测试V4新模型并向华为授权 #21
据报道,DeepSeek正在内测代号为
V4 Lite的新模型,并已向华为提供提前访问权以优化硬件适配,而英伟达和AMD目前未获授权。社交媒体爆料称,该模型支持1M上下文窗口及原生多模态,SVG生成效果在细节和准确性上均优于前代。
据路透社及多家信源报道,DeepSeek正在测试未发布的V4模型,并向华为等国内供应商提供提前访问权以优化处理器软件,英伟达和AMD暂未获权。社交媒体爆料称,代号为“sealion-lite”的V4 Lite支持1M上下文窗口及原生多模态推理。流出的SVG示例显示,其在非思考模式下的表现优于上一代V3.2的思考模式。社区讨论认为,若该模型实现低成本长上下文推理,或将改变行业格局。目前DeepSeek官方尚未对此做出回应。



亚马逊据传将向OpenAI投资高达500亿美元 #22
据报道,亚马逊正洽谈向 OpenAI 投资最高达 500亿美元,其中 350亿美元 资金将取决于 OpenAI 是否实现 AGI 或完成 IPO。作为合作条件,OpenAI 将扩大使用亚马逊
Trainium芯片,并为 Alexa 开发定制模型。
据 The Information 报道,亚马逊正洽谈向 OpenAI 投资高达 500 亿美元。交易拟分两阶段:初期投入 150 亿美元,剩余 350 亿美元视 OpenAI 实现 AGI 或完成 IPO 而定。此举源于 OpenAI 预计未来五年算力成本将达 6650 亿美元,需深化云合作,包括扩大使用 亚马逊 Trainium 芯片及为 Alexa 开发模型。此外报道指出,软银和英伟达计划各投资 300 亿美元,微软尚未决定是否跟投。

相关链接:
据传谷歌与Meta签署数十亿美元AI芯片协议 #23
据 The Information 报道,Google 与 Meta 签署了价值数十亿美元的 AI 芯片协议;与此同时,Meta 因设计困境已废弃其最先进的内部 AI 训练芯片项目
Metis。
据 The Information 独家报道,Google 已与 Meta 达成一项价值数十亿美元的 AI 芯片交易,此举进一步加剧了 Google 与 Nvidia 的市场竞争。同时,Meta 因设计困境已废弃其最先进的内部 AI 训练芯片项目。这一挫折凸显了科技巨头试图在硬件领域挑战 Nvidia 主导地位所面临的极高难度。
相关链接:
GPT-5.3被曝或已上线Arena #24
X 平台消息称 GPT-5.3 已上线
LM Arena,代号为vortex和zephyr。
据X用户leo 🐾称,GPT-5.3已登陆LM Arena,代号为“vortex”和“zephyr”。社区反馈显示,目前Battle模式极难匹配到这两个模型,且列表中未见显示。

相关链接:
传Meta两款AI模型亮相测试平台 #25
代号为 Mint 和 Chocolate 的
AI 模型现身 Design Arena 平台,外界猜测其与 Meta 的Avocado模型有关。
据社交媒体消息披露,两款代号为“Mint”和“Chocolate”的新AI模型近期现身Design Arena平台,其测试页面信息显示创建者为 Meta AI。针对模型背景,社区讨论推测其可能与 Meta 超智能团队的 Avocado 模型有关,但该说法尚未得到确切证实。目前, Meta 官方尚未对此发布正式声明。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。