DeepSeek-R1

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

一个强大的混合专家 (MoE) 语言模型,总共有 671B 个参数,每个标记激活 37B 个参数。

DeepSeek R1 各模型的硬件需求清单(估算):

模型版本 参数量 模型大小 CPU 显卡 内存 磁盘空间 成本
1.5b 15亿 1.1GB 普通四核及以上处理器 非必须 16GB+ 50GB+ 5000以内
7b 70亿 4.7GB 6核或8核处理器 RTX 3060及以上 32GB+ 100GB+ 1万以内
8b 80亿 4.9GB 6核或8核处理器 RTX 3060及以上 32GB+ 100GB+ 1万以内
14b 140亿 9GB 8核及以上处理器 RTX 4090及以上 64GB+ 200GB+ 2、3万
32b 320亿 20GB 8核及以上处理器 RTX 3090/A100及以上 128GB+ 500GB+ 几万-10来万
70b 700亿 43GB 12核及以上处理器
推荐高端Intel/AMD处理器
A100/V100显卡及以上
可能还得多个显卡一起用
128GB+ 1TB+ 40万+
671b 6710亿 404GB 高性能、多核CPU,建议多台服务器配置 多个A100/V100显卡 512GB+ 2TB+ 200万+

选哪种类型的 DeepSeek-R1 模型,就得看看自己的电脑配置和钱包,也得看你的实际应用场景:

  • 如果只是简单的文本处理、学习用途或者小型应用,选 1.5b、7b、8b 就够了。
  • 如果要生成高质量文本、中型应用,推荐使用 14b 及以上的型号。
  • 如果是企业级应用、大型应用,就必须上 32b、70b、671b 型号。
作者:Jeebiz  创建时间:2025-02-07 10:26
最后编辑:Jeebiz  更新时间:2025-05-12 09:20