DeepSeek-R1
DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。
一个强大的混合专家 (MoE) 语言模型,总共有 671B 个参数,每个标记激活 37B 个参数。
DeepSeek R1 各模型的硬件需求清单(估算):
模型版本 | 参数量 | 模型大小 | CPU | 显卡 | 内存 | 磁盘空间 | 成本 |
---|---|---|---|---|---|---|---|
1.5b | 15亿 | 1.1GB | 普通四核及以上处理器 | 非必须 | 16GB+ | 50GB+ | 5000以内 |
7b | 70亿 | 4.7GB | 6核或8核处理器 | RTX 3060及以上 | 32GB+ | 100GB+ | 1万以内 |
8b | 80亿 | 4.9GB | 6核或8核处理器 | RTX 3060及以上 | 32GB+ | 100GB+ | 1万以内 |
14b | 140亿 | 9GB | 8核及以上处理器 | RTX 4090及以上 | 64GB+ | 200GB+ | 2、3万 |
32b | 320亿 | 20GB | 8核及以上处理器 | RTX 3090/A100及以上 | 128GB+ | 500GB+ | 几万-10来万 |
70b | 700亿 | 43GB | 12核及以上处理器 推荐高端Intel/AMD处理器 |
A100/V100显卡及以上 可能还得多个显卡一起用 |
128GB+ | 1TB+ | 40万+ |
671b | 6710亿 | 404GB | 高性能、多核CPU,建议多台服务器配置 | 多个A100/V100显卡 | 512GB+ | 2TB+ | 200万+ |
选哪种类型的 DeepSeek-R1 模型,就得看看自己的电脑配置和钱包,也得看你的实际应用场景:
- 如果只是简单的文本处理、学习用途或者小型应用,选 1.5b、7b、8b 就够了。
- 如果要生成高质量文本、中型应用,推荐使用 14b 及以上的型号。
- 如果是企业级应用、大型应用,就必须上 32b、70b、671b 型号。
作者:Jeebiz 创建时间:2025-02-07 10:26
最后编辑:Jeebiz 更新时间:2025-05-12 09:20
最后编辑:Jeebiz 更新时间:2025-05-12 09:20