示例页面

你好

4 月 24, 2026

—

由

sailmans

于 win时光

4月24日消息，DeepSeek V4预览版今天上午官宣上线。

根据DeepSeek的官方介绍，V4系列包含两个MoE模型：DeepSeek-V4-Pro总参数1.6T、激活参数49B，DeepSeek-V4-Flash总参数 284B、激活参数13B，两者均原生支持100万token 上下文。

在1M上下文设置下，V4-Pro的单token推理FLOPs只有V3.2的27%，KV Cache只有10%；V4-Flash更极端，分别压到10%和7%。DeepSeek自己给这代模型的定位是“preview version”，官方在报告中明确表示，V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro，“发展轨迹大约滞后前沿闭源模型3至6个月”。

换句话说，V4预览版是把长上下文成本重构,为下一阶段test-time scaling和长程任务铺路的基础设施发布，没有强调能力上的跨越升级。

软粉时光

关于

团队
历史
职业

隐私

隐私政策
条款
联系我们

社交

Facebook
Instagram
Twitter / X

用 WordPress 设计