AI 早报 2026-03-09

视频版哔哩哔哩YouTube

概览

要闻

  • 深圳龙岗拟扶持 OpenClaw;工信部预警其安全风险 #1

开发生态

  • Codex 重置 Plus 与 Pro 订阅限额 #2
  • OpenClaw 发布 v2026.3.7,新增 ACP 绑定 #3

技术与洞察

  • Karpathy 开源 autoresearch 实现单 GPU 自动 LLM 训练实验 #4
  • Kilo 发布 PinchBench 榜单,Gemini-3 以 95.1% 登顶 #5

前瞻与传闻

  • 腾讯内测 QClaw 本地部署包,支持微信直连 #6

深圳龙岗拟扶持 OpenClaw;工信部预警其安全风险 #1

据报道,深圳龙岗区起草支持 OpenClawOPC 发展的相关文件并公开征求意见。同期工信部监测发现,OpenClaw 存在默认配置下的网络安全风险,建议核查公网暴露及权限配置。

深圳市龙岗区人工智能(机器人)署起草《深圳市龙岗区支持 OpenClaw&OPC 发展的若干措施(征求意见稿)》,政策聚焦“一人公司”(OPC)创新单元,以 OpenClaw 智能体为技术抓手,结合龙岗区人工智能全域全时应用示范区及智能硬件产业链优势进行扶持。

同期,工业和信息化部网络安全威胁和漏洞信息共享平台监测发现,OpenClaw 开源 AI 智能体在默认配置下存在网络安全风险,可能因信任边界模糊导致信息泄露或系统受控。部署单位应核查公网暴露及权限配置,关闭不必要访问,完善身份认证与安全审计机制。

相关链接:


Codex 重置 Plus 与 Pro 订阅限额 #2

因用户反馈的 Codex 用量异常问题,Codex 已于北京时间 3月8日 上午重置了速率限制。Codex 团队正在调查相关问题,预计一到三天内完成。

因用户反馈的 Codex 用量异常问题,Codex 已于北京时间 3月8日 上午重置了速率限制。Codex 团队正在调查相关问题,预计一到三天内完成。

相关链接:


OpenClaw 发布 v2026.3.7,新增 ACP 绑定 #3

OpenClaw 发布更新,通过 ACP 实现了 Claude Code 等 coding agents 在 Discord channels 的持久化绑定,优化 Docker 构建并修复多项连接问题。

OpenClaw 推出 v2026.3.7 版本,已在 GitHub 开源。更新扩展支持 GPT-5.4Gemini 3.1 Flash Lite 模型。通过 Agent Client Protocol(ACP)实现 Claude CodeCodex 等 coding agents 在 Tg topics 与 Discord channels 中的持久化绑定,状态重启后保留。

技术层面,Docker 构建采用多阶段策略生成 slim 镜像,网关认证引入 SecretRef 机制,上下文引擎支持插件化,图片模块新增 HEIF 格式支持。此外,修复了 Zalo channel 连接及 Discord 集成多项问题,包括 bot 循环、命令挂起及语音稳定性等。

相关链接:


Karpathy 开源 autoresearch 实现单 GPU 自动 LLM 训练实验 #4

Andrej Karpathy 发布开源项目 autoresearch,让 AI Agent 在单张 GPU 上自动运行大模型训练实验。用户只需编写研究指令,Agent 就能自行迭代代码、评估指标并自主决策。

Andrej Karpathy 推出开源项目 autoresearch,旨在单 GPU 环境下实现 AI Agent 自动运行 LLM 训练实验。项目基于 nanochat 核心,人类通过 program.md 设定指令,Agent 迭代 train.py 代码。训练限制在 5 分钟 内,每小时约运行 12 次 实验,夜间可累积约 100 次。核心评估指标为 val_bpb

代码库含 prepare.pytrain.pyprogram.md 三个关键文件,仅 train.py 可被编辑。项目依赖单张 NVIDIA GPU,采用 MIT 协议。未来愿景是实现 Agent 间异步大规模协作,模拟研究社区。

目前代码已在 GitHub 开放,无正式版本,需手动验证环境后接入模型启动。

相关链接:


Kilo 发布 PinchBench 榜单,Gemini-3 以 95.1% 登顶 #5

Kilo 上月发布 PinchBench 基准测试,该测试旨在评估 LLM 接入 OpenClaw 在真实任务中的表现,涵盖日程、代码、邮件等任务。最新榜单数据显示,谷歌 Gemini-3-Flash-Preview95.1% 成功率登顶。

Kilo.ai 开发了开源基准测试系统 PinchBench,旨在评估 LLM 接入 OpenClaw 在真实任务中的表现。该测试涵盖日程安排、代码编写等 23 项标准化任务,采用自动化检查与 LLM 评判结合评分。

官网最新数据显示,32 个模型累计运行 183 次,Googlegemini-3-flash-preview95.1% 成功率位居榜首,MiniMaxminimax-m2.1MoonshotAIkimi-k2.5 分别以 93.6%93.4% 位列第二、三名,Anthropicclaude-sonnet-4.5 居第四。

所有任务定义及评分逻辑已在 GitHub 开源。

相关链接:


腾讯内测 QClaw 本地部署包,支持微信直连 #6

据报道,腾讯正在内测名为 QClaw 的应用,支持本地一键部署 OpenClaw,可通过个人微信直连,产品预计近期上线。

据报道,腾讯正在研发基于 OpenClaw 的一键启动包 QClaw,当前处于内测阶段,预计近期上线。该产品支持本地化部署运行,用户下载后可一键部署环境,程序在本地而非云端运行。连接渠道方面,QClaw 支持飞书、钉钉、QQ和个人微信。模型层面采用混合路由模型,支持国内热门模型拼盘及自定义配置。


提示:内容由AI辅助创作,可能存在幻觉错误