2026-03-02

AI 早报 2026-03-02
概览
模型发布
- Cognition发布SWE-1.6早期预览版 ↗
#1
产品应用
- Claude登顶App Store;上线记忆导入功能 ↗
#2
技术与洞察
行业动态
- 美军在空袭伊朗行动中使用了 Claude ↗
#5
前瞻与传闻
- Qwen 3.5传即将推出四款小型稠密开源模型 ↗
#6
Cognition发布SWE-1.6早期预览版 #1
Cognition 发布了
SWE-1.6模型的早期预览版,该模型在SWE-Bench Pro上的得分比前代高出 11%,并超越了顶尖开源模型。团队正面向 Windsurf 的部分用户开放早期访问,以收集反馈并修复缺陷。
Cognition发布SWE-1.6模型早期预览版。该模型在SWE-Bench Pro基准测试中得分较SWE-1.5提升11%,超越顶尖开源模型,并保持950 tok/s的运行速度。官方通过改进RL配方及扩展基础设施,使计算投入增加两个数量级,利用GB200芯片及NVFP4精度优化训练。尽管智能提升,模型目前仍存在过度思考和过度自检等行为。团队正面向Windsurf部分用户推出早期访问,旨在收集反馈以修复缺陷。

相关链接:
Claude登顶App Store;上线记忆导入功能 #2
受争议影响,Anthropic 旗下 Claude 应用逆势登顶美国 App Store 免费榜。与此同时,Claude 上线了记忆导入功能,付费用户可使用特定提示词从原
AI导出记忆,再一键导入 Claude 。
据媒体报道,受与美国政府的争议影响,Claude排名逆势飙升,近期在美区App Store超越ChatGPT登顶。
与此同时,Anthropic正式上线“记忆导入”功能。该功能允许付费用户通过特定Prompt,从其他AI服务商导出偏好、项目背景及个性化指令等上下文,一键导入Claude记忆库。


相关链接:
- https://claude.com/import-memory
- https://techcrunch.com/2026/03/01/anthropics-claude-rises-to-no-2-in-the-app-store-following-pentagon-dispute
Anthropic研究揭示LLM低成本去匿名化威胁 #3
苏黎世联邦理工学院联合 Anthropic 发布研究,证实商用大模型仅需 1 至 4 美元 成本,便能在数分钟内通过分析非结构化文本,将网络匿名账户与真实身份精准关联。
苏黎世联邦理工学院与 Anthropic 研究人员发表研究,揭示商用大模型(LLM)能以极低成本(每用户 1至4美元)在数分钟内实现网络去匿名化。该自动化 Pipeline 无需依赖传统结构化数据,直接通过分析非结构化文本提取身份特征并进行匹配。实验显示,在 Hacker News 用户测试中,AI以 90% 的精确度成功识别了约 67% 的目标;在 Reddit 跨社区及时间分割测试中,表现远超传统方法。即便面对百万级候选池,推算成功率仍达 35%至45%。研究人员警告,由于该流程由看似合法的“总结、搜索、排序”步骤构成,防御极具难度,网络匿名的“实际模糊性”保护已失效,用户发布的微观数据均可能被用于身份关联。

相关链接:
Anthropic分享构建Claude Code工具经验 #4
Anthropic 团队分享了构建 Claude Code 的关键经验,强调设计 Agent 的行动空间必须与模型能力动态匹配。随着模型能力提升,开发者需不断重新评估并优化工具设计,学会像 Agent 一样观察。
Anthropic 团队近日分享构建 Claude Code 的经验,指出设计 Agent 行动空间需适配模型能力。在工具演变上,团队开发了 AskUserQuestion 工具以实现结构化提问;随模型能力提升,将 TodoWrite 升级为更利于 Subagent 协作的 Task Tool。在上下文构建方面,团队从依赖 RAG 转向赋予模型 Grep 工具和 Agent Skills,使其通过“渐进式披露”自主发现上下文。此外,通过引入 Claude Code Guide subagent 解决模型对自身功能认知不足的问题。这些经验表明,工具设计既是科学也是艺术,需要开发者不断实验并学会“像 Agent 一样观察”。



相关链接:
美军在空袭伊朗行动中使用了 Claude #5
据媒体报道,美军在对伊朗的大规模空袭中使用
Claude模型进行情报评估和目标识别。
据媒体报道,在特朗普宣布联邦政府禁用 Anthropic 数小时后,美军在对伊朗的大规模空袭中仍使用了 Claude。知情人士证实,美中央司令部利用该工具进行了情报评估与目标识别。特朗普虽下令禁用,但鉴于技术已嵌入军事平台,国防部有 6个月 的淘汰过渡期。
相关链接:
Qwen 3.5传即将推出四款小型稠密开源模型 #6
Qwen团队暗示即将发布 Qwen 3.5 系列小参数量的多款模型。据社交媒体上的传闻,可能包括四款模型,参数量分别为
0.8B、2B、4B、9B。
据 Qwen 团队负责人暗示,Qwen 3.5 系列即将推出小参数量的多个模型。根据社交媒体上流传的消息,可能会有 0.8B、2B、4B 及 9B 四款 Small Dense 开源模型,旨在完善端侧及消费级显卡生态。该系列预计同步推出 Base 和 Instruct 版本,或支持 256K 上下文及原生 VL 能力。


相关链接:
- https://x.com/JustinLin610/status/2028072650619380067
- https://x.com/casper_hansen_/status/2028146268229579074
提示:内容由AI辅助创作,可能存在幻觉和错误。