2026-04-26

AI 早报 2026-04-26
概览
要闻
模型发布
开发生态
产品应用
前瞻与传闻
- Google Cloud CEO 称即将推出新 Gemini 模型 ↗
#9
DeepSeek 限时下调 V4-Pro 模型 API 价格,更新开发工具版本要求 #1
DeepSeek 宣布针对 DeepSeek-V4-Pro 模型的 API 价格,开启为期十天的 2.5 折限时特惠。
优惠截止至 5 月 5 日 23:59。
官方同时提醒开发者,使用 Claude Code 开启 1M 上下文时,需将模型设置为
deepseek-v4-pro[1m]。接入 OpenCode 和 OpenClaw 也需升级至最新版本。
DeepSeek 官方宣布针对 DeepSeek-V4-Pro 模型 API 推出限时优惠活动,价格降幅达 75%(即 2.5 折特惠)。
该特惠活动将持续约十日,至5 月 5 日的 23:59 截止。官方同步更新了相关开发工具的集成适配说明。
在功能适配上,当用户使用 Claude Code 接入该模型并希望开启 1M 上下文功能时,必须将目标模型名称设置为 deepseek-v4-pro[1m]。
同时,官方明确指出了接入其他工具的建议版本门槛:OpenCode 需升级至 v1.14.24 及以上版本。
而 OpenClaw 则需升级至 v2026.4.24 及以上版本。

相关链接:
- https://api-docs.deepseek.com/zh-cn/quick_start/pricing/
- https://x.com/deepseek_ai/status/2048062777357750316
DeepSeek 员工发布 DeepSeek-V4 思维链角色扮演模式指令 #2
DeepSeek员工在 GitHub 上分享了可以开启 DeepSeek-V4 角色扮演模式的
Prompt。用户可以使用该提示词,在官方 APP 和网页端专家模式或 API 中切换 DeepSeek-V4 模型的思维风格。用户可选择将模型切换为带有内心戏的“角色沉浸”模式,也可调整为纯分析模式。
DeepSeek 员工在 GitHub 上发布了针对 DeepSeek-V4 角色扮演的特殊控制指令说明,旨在帮助用户在思考模式下切换思维链风格。
该指令适用于 DeepSeek 官方 APP 及网页的专家模式。同时,它也支持 deepseek-v4-flash 和 deepseek-v4-pro 的 API,但网页端的快速模式暂不支持。
用户通过特定 Prompt 使模型思维链风格在“角色沉浸”与“纯分析”两种模式间切换。若不加任何指令,则保持由模型根据场景复杂度自动选择的“默认”模式。
官方说明提示,该指令目前无法保证 100% 触发期望效果,但能稳定增加出现特定格式思考过程的概率。此外,其指令仅直接影响模型的思考过程,但思考方式会间接改变最终回复的表现形式。


相关链接:
- https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/
- https://x.com/victor207755822/status/2048071983452356925
通义千问发布 Qwen-Image-2.0-Pro #3
Qwen 团队发布了图像生成模型
Qwen-Image-2.0-Pro。该模型在图像质量与文本渲染等核心能力上显著提升,并在相关榜单中排名 第九。
现已开放在线体验和
API调用服务。
千问团队近日正式发布图像生成模型 Qwen-Image-2.0-Pro,该模型在图像质量、多语言文本渲染和指令遵循能力上实现显著提升。同时,在不同风格间的表现一致性也得到增强。
据官方公布的 Arena 榜单数据,该模型在 Text-to-Image 类别中排名全球 第 9。此外,其在肖像、摄影写实与电影感影像、艺术等子类别均进入前 10。
用户可通过 ModelScope 在线体验,或通过 阿里云 API 调用。API 模型版本为 qwen-image-2.0-pro-2026-04-22。


相关链接:
- https://modelscope.ai/studios/Qwen/Qwen-Image-2.0-pro
- https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen-image-2.0-pro-2026-04-22&serviceSite=international
美团开放 LongCat-2.0-Preview 邀请测试 #4
美团近期开放了其新一代基础大模型
LongCat-2.0-Preview的邀请测试。每日 0点,在
longcat开放平台上提供有限名额供用户申请。
据媒体报道,美团现已开放其新一代基础大模型 LongCat-2.0-Preview 的邀请测试。
每日 0 点,在 longcat 开放平台上提供有限名额供用户申请。
据知情人士透露,该模型总参数规模突破 万亿。
其完全基于国产化算力集群训练,这表明 美团 可能已率先在使用国产算力训练万亿参数模型上取得突破。

相关链接:
Cursor 发布 3.2 版,引入/multitask 指令和异步 subagent 等功能 #5
Cursor 发布了 Cursor 3.2 版本。
新版本新增
/multitask指令、异步subagent和全新改进的workspace等功能。这些更新旨在支持多任务并行处理与跨库代码操作。
Cursor 宣布推出 Cursor 3.2 版本,引入 /multitask 指令。
根据官方说明,Cursor 现在能够运行异步 subagent 来并行处理用户的请求,以取代传统的排队机制。对于已经处于队列中的消息,用户可以直接要求 Cursor 对其执行多任务操作,从而无需等待当前正在运行的任务完成。
除了异步 subagent,实现工作并行化的另一种方式是使用 agents 窗口中经过全新改进的 worktrees 功能。该功能允许用户在后台的不同分支上运行相互隔离的任务,并在准备好测试更改时,通过单击操作将任何分支移动到本地前台。
此外,官方还为跨 repo 的代码更改引入了多根 workspace,使得单个 Agent 会话现在可以指向一个由多个文件夹组成的可复用 workspace。

相关链接:
OpenClaw 发布更新,优化语音与浏览器自动化功能 #6
OpenClaw 发布了 2026.4.24 版本更新。
这次升级让语音交互功能可以把复杂问题交接给完整的
Agent处理,并按需调用工具。同时正式引入了 DeepSeek V4 系列模型,大幅优化了浏览器自动化控制等多项功能。
OpenClaw 官方宣布推出 2026.4.24 版本更新。
根据官方公告显示,本次更新的核心在于提升了语音交互与工具调用的协同能力。Talk 和 Voice Call 功能现在可以将更深层次的问题交接给完整的 OpenClaw Agent。这一改进能够在保持实时语音响应速度的同时,按需调用各类工具。
在模型支持方面,DeepSeek V4 Flash 与 DeepSeek V4 Pro 正式加入该平台。该版本同时修复了该系列模型的相关问题。
此外,该版本的浏览器自动化功能迎来了多项实用性改进。新增功能包括坐标点击、配置文件级别的无头模式覆盖、稳定的标签页复用以及陈旧锁恢复机制,并延长了默认操作预算。
官方还修复了涉及 Tg、Slack、MCP、sessions 和 TTS 等多项功能的问题。

相关链接:
- https://github.com/openclaw/openclaw/releases/tag/v2026.4.24
- https://x.com/openclaw/status/2048124737918751035
百度网盘推出 AI Agent 技能,支持自然语言操作 #7
有用户发现,百度网盘推出了专为 AI 智能体打造的
Baidu Netdisk skill。用户可以用自然语言直接让智能体去执行文件的上传、下载和搜索。
百度网盘推出了针对 AI Agent 的 Baidu Netdisk skill,为 Agent 赋予“长效记忆”与“物流系统”,使其能以自然语言交互执行上传、下载、搜索、分享等文件操作。
该功能原生适配 OpenClaw Agent。为保障数据隐私,该系统采用安全沙箱隔离设计,仅限操作 /我的应用数据/bdpan/ 指定目录,物理隔离主盘数据,并通过 OAuth 2.0 协议与 Token 本地加密确保授权安全。
对 OpenClaw 接入,用户需向 OpenClaw 发送命令 npx clawhub@latest install baidu-netdisk-storage。
安装就绪后,用户需向 Agent 发送“登录 Baidu Netdisk"指令,并根据返回的链接完成 OAuth 授权与网盘账号绑定。

相关链接:
- https://pan.baidu.com/apaastobui/developer#/developer/skill
- https://github.com/baidu-netdisk/bdpan-storage/issues
- https://linux.do/t/topic/2055235
Grok Imagine 升级图生视频功能,改善唇形同步与音质 #8
Grok宣布升级 Grok Imagine图生视频生成功能。
大幅提升了唇形同步效果和音频音质。
让声音与嘴部动作精准匹配。
Grok Imagine 近日宣布对其图生视频生成功能进行升级。
官方表示,该功能在所有生成任务中大幅改善了唇形同步效果,并提供更清晰的音频音质。
据官方声明,此项技术使生成对话能精准追踪嘴部动作,声音与场景完美匹配,视听效果符合创作者预期。

相关链接:
Google Cloud CEO 称即将推出新 Gemini 模型 #9
Google Cloud CEO 在近期访谈中全面阐述了 谷歌的全栈
AI战略布局。他介绍称,谷歌在第八代TPU芯片进行了细分,以控制推理成本。此外,该公司还即将推出表现优异的新一代Gemini模型。
Google Cloud CEO 在近期的一次深度访谈中,全面阐述了谷歌作为具备全栈 AI 能力巨头的战略布局与技术进展。
在算力基础设施方面,谷歌正将其第八代 TPU 细分为专攻训练的 8T 与主打推理的 8i,旨在应对日益增长的推理成本控制需求。
在模型研发层面,其确认即将推出在内部基准测试中表现优异的新一代 Gemini 模型,并指出其早已部署的“解耦服务”技术足以支撑传闻中高达 10 万亿参数的 Mythos 等超大模型的高效推理。
在商业生态上,他明确谷歌作为平台公司的定位,既在模型层与 Anthropic 等对手竞争,也为其提供基础设施支持。
相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。