- N +

DeepSeek新系列模型上线

4 月 24 日,DeepSeek 官方宣布,全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源," 迈入百万上下文普惠时代 "。

据悉,DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为 pro 和 flash 两个版本,DeepSeek-V4-Flash 是更快捷高效的经济之选。

官方称 DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。

返回列表
上一篇:
下一篇:

发表评论中国互联网举报中心

快捷回复:

    评论列表 (暂无评论,共3人参与)参与讨论

    还没有评论,来说两句吧...