AI 早报 2026-04-26

视频版哔哩哔哩YouTube

概览

要闻

  • DeepSeek 限时下调 V4-Pro 模型 API 价格,更新开发工具版本要求 #1
  • DeepSeek 员工发布 DeepSeek-V4 思维链角色扮演模式指令 #2

模型发布

  • 通义千问发布 Qwen-Image-2.0-Pro #3
  • 美团开放 LongCat-2.0-Preview 邀请测试 #4

开发生态

  • Cursor 发布 3.2 版,引入/multitask 指令和异步 subagent 等功能 #5
  • OpenClaw 发布更新,优化语音与浏览器自动化功能 #6

产品应用

  • 百度网盘推出 AI Agent 技能,支持自然语言操作 #7
  • Grok Imagine 升级图生视频功能,改善唇形同步与音质 #8

前瞻与传闻

  • Google Cloud CEO 称即将推出新 Gemini 模型 #9

DeepSeek 限时下调 V4-Pro 模型 API 价格,更新开发工具版本要求 #1

DeepSeek 宣布针对 DeepSeek-V4-Pro 模型的 API 价格,开启为期十天的 2.5 折限时特惠。

优惠截止至 5 月 5 日 23:59

官方同时提醒开发者,使用 Claude Code 开启 1M 上下文时,需将模型设置为 deepseek-v4-pro[1m]

接入 OpenCodeOpenClaw 也需升级至最新版本。

DeepSeek 官方宣布针对 DeepSeek-V4-Pro 模型 API 推出限时优惠活动,价格降幅达 75%(即 2.5 折特惠)。

该特惠活动将持续约十日,至5 月 5 日23:59 截止。官方同步更新了相关开发工具的集成适配说明。

在功能适配上,当用户使用 Claude Code 接入该模型并希望开启 1M 上下文功能时,必须将目标模型名称设置为 deepseek-v4-pro[1m]

同时,官方明确指出了接入其他工具的建议版本门槛:OpenCode 需升级至 v1.14.24 及以上版本。

OpenClaw 则需升级至 v2026.4.24 及以上版本。

相关链接:


DeepSeek 员工发布 DeepSeek-V4 思维链角色扮演模式指令 #2

DeepSeek员工在 GitHub 上分享了可以开启 DeepSeek-V4 角色扮演模式的 Prompt。用户可以使用该提示词,在官方 APP 和网页端专家模式或 API 中切换 DeepSeek-V4 模型的思维风格。

用户可选择将模型切换为带有内心戏的“角色沉浸”模式,也可调整为纯分析模式。

DeepSeek 员工在 GitHub 上发布了针对 DeepSeek-V4 角色扮演的特殊控制指令说明,旨在帮助用户在思考模式下切换思维链风格。

该指令适用于 DeepSeek 官方 APP 及网页的专家模式。同时,它也支持 deepseek-v4-flashdeepseek-v4-pro 的 API,但网页端的快速模式暂不支持。

用户通过特定 Prompt 使模型思维链风格在“角色沉浸”与“纯分析”两种模式间切换。若不加任何指令,则保持由模型根据场景复杂度自动选择的“默认”模式。

官方说明提示,该指令目前无法保证 100% 触发期望效果,但能稳定增加出现特定格式思考过程的概率。此外,其指令仅直接影响模型的思考过程,但思考方式会间接改变最终回复的表现形式。

相关链接:


通义千问发布 Qwen-Image-2.0-Pro #3

Qwen 团队发布了图像生成模型 Qwen-Image-2.0-Pro

该模型在图像质量与文本渲染等核心能力上显著提升,并在相关榜单中排名 第九

现已开放在线体验和 API 调用服务。

千问团队近日正式发布图像生成模型 Qwen-Image-2.0-Pro,该模型在图像质量、多语言文本渲染和指令遵循能力上实现显著提升。同时,在不同风格间的表现一致性也得到增强。

据官方公布的 Arena 榜单数据,该模型在 Text-to-Image 类别中排名全球 第 9。此外,其在肖像、摄影写实与电影感影像、艺术等子类别均进入前 10

用户可通过 ModelScope 在线体验,或通过 阿里云 API 调用。API 模型版本为 qwen-image-2.0-pro-2026-04-22

相关链接:


美团开放 LongCat-2.0-Preview 邀请测试 #4

美团近期开放了其新一代基础大模型 LongCat-2.0-Preview 的邀请测试。

每日 0点,在 longcat 开放平台上提供有限名额供用户申请。

据媒体报道,美团现已开放其新一代基础大模型 LongCat-2.0-Preview 的邀请测试。

每日 0 点,在 longcat 开放平台上提供有限名额供用户申请。

据知情人士透露,该模型总参数规模突破 万亿

其完全基于国产化算力集群训练,这表明 美团 可能已率先在使用国产算力训练万亿参数模型上取得突破。

相关链接:


Cursor 发布 3.2 版,引入/multitask 指令和异步 subagent 等功能 #5

Cursor 发布了 Cursor 3.2 版本。

新版本新增 /multitask 指令、异步 subagent 和全新改进的 workspace 等功能。

这些更新旨在支持多任务并行处理与跨库代码操作。

Cursor 宣布推出 Cursor 3.2 版本,引入 /multitask 指令。

根据官方说明,Cursor 现在能够运行异步 subagent 来并行处理用户的请求,以取代传统的排队机制。对于已经处于队列中的消息,用户可以直接要求 Cursor 对其执行多任务操作,从而无需等待当前正在运行的任务完成。

除了异步 subagent,实现工作并行化的另一种方式是使用 agents 窗口中经过全新改进的 worktrees 功能。该功能允许用户在后台的不同分支上运行相互隔离的任务,并在准备好测试更改时,通过单击操作将任何分支移动到本地前台。

此外,官方还为跨 repo 的代码更改引入了多根 workspace,使得单个 Agent 会话现在可以指向一个由多个文件夹组成的可复用 workspace。

相关链接:


OpenClaw 发布更新,优化语音与浏览器自动化功能 #6

OpenClaw 发布了 2026.4.24 版本更新。

这次升级让语音交互功能可以把复杂问题交接给完整的 Agent 处理,并按需调用工具。

同时正式引入了 DeepSeek V4 系列模型,大幅优化了浏览器自动化控制等多项功能。

OpenClaw 官方宣布推出 2026.4.24 版本更新。

根据官方公告显示,本次更新的核心在于提升了语音交互与工具调用的协同能力。TalkVoice Call 功能现在可以将更深层次的问题交接给完整的 OpenClaw Agent。这一改进能够在保持实时语音响应速度的同时,按需调用各类工具。

在模型支持方面,DeepSeek V4 FlashDeepSeek V4 Pro 正式加入该平台。该版本同时修复了该系列模型的相关问题。

此外,该版本的浏览器自动化功能迎来了多项实用性改进。新增功能包括坐标点击、配置文件级别的无头模式覆盖、稳定的标签页复用以及陈旧锁恢复机制,并延长了默认操作预算。

官方还修复了涉及 TgSlackMCPsessionsTTS 等多项功能的问题。

相关链接:


百度网盘推出 AI Agent 技能,支持自然语言操作 #7

有用户发现,百度网盘推出了专为 AI 智能体打造的 Baidu Netdisk skill

用户可以用自然语言直接让智能体去执行文件的上传、下载和搜索。

百度网盘推出了针对 AI AgentBaidu Netdisk skill,为 Agent 赋予“长效记忆”与“物流系统”,使其能以自然语言交互执行上传、下载、搜索、分享等文件操作。

该功能原生适配 OpenClaw Agent。为保障数据隐私,该系统采用安全沙箱隔离设计,仅限操作 /我的应用数据/bdpan/ 指定目录,物理隔离主盘数据,并通过 OAuth 2.0 协议与 Token 本地加密确保授权安全。

OpenClaw 接入,用户需向 OpenClaw 发送命令 npx clawhub@latest install baidu-netdisk-storage

安装就绪后,用户需向 Agent 发送“登录 Baidu Netdisk"指令,并根据返回的链接完成 OAuth 授权与网盘账号绑定。

相关链接:


Grok Imagine 升级图生视频功能,改善唇形同步与音质 #8

Grok宣布升级 Grok Imagine图生视频生成功能。

大幅提升了唇形同步效果音频音质

让声音与嘴部动作精准匹配。

Grok Imagine 近日宣布对其图生视频生成功能进行升级。

官方表示,该功能在所有生成任务中大幅改善了唇形同步效果,并提供更清晰的音频音质。

据官方声明,此项技术使生成对话能精准追踪嘴部动作,声音与场景完美匹配,视听效果符合创作者预期。

相关链接:


Google Cloud CEO 称即将推出新 Gemini 模型 #9

Google Cloud CEO 在近期访谈中全面阐述了 谷歌的全栈 AI 战略布局。他介绍称,谷歌在第八代 TPU 芯片进行了细分,以控制推理成本。此外,该公司还即将推出表现优异的新一代 Gemini 模型。

Google Cloud CEO 在近期的一次深度访谈中,全面阐述了谷歌作为具备全栈 AI 能力巨头的战略布局与技术进展。

在算力基础设施方面,谷歌正将其第八代 TPU 细分为专攻训练的 8T 与主打推理的 8i,旨在应对日益增长的推理成本控制需求。

在模型研发层面,其确认即将推出在内部基准测试中表现优异的新一代 Gemini 模型,并指出其早已部署的“解耦服务”技术足以支撑传闻中高达 10 万亿参数的 Mythos 等超大模型的高效推理。

在商业生态上,他明确谷歌作为平台公司的定位,既在模型层与 Anthropic 等对手竞争,也为其提供基础设施支持。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误