目录搜索展开

暂无相关搜索结果！

阅读次数：296

本文档使用 MinDoc 发布

DeepSeek-R1

DeepSeek-R1

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中，DeepSeek-V3 在开源模型中位列榜首，与世界上最先进的闭源模型不分伯仲。

一个强大的混合专家 (MoE) 语言模型，总共有 671B 个参数，每个标记激活 37B 个参数。

DeepSeek R1 各模型的硬件需求清单（估算）：

模型版本	参数量	模型大小	CPU	显卡	内存	磁盘空间	成本
1.5b	15亿	1.1GB	普通四核及以上处理器	非必须	16GB+	50GB+	5000以内
7b	70亿	4.7GB	6核或8核处理器	RTX 3060及以上	32GB+	100GB+	1万以内
8b	80亿	4.9GB	6核或8核处理器	RTX 3060及以上	32GB+	100GB+	1万以内
14b	140亿	9GB	8核及以上处理器	RTX 4090及以上	64GB+	200GB+	2、3万
32b	320亿	20GB	8核及以上处理器	RTX 3090/A100及以上	128GB+	500GB+	几万-10来万
70b	700亿	43GB	12核及以上处理器推荐高端Intel/AMD处理器	A100/V100显卡及以上可能还得多个显卡一起用	128GB+	1TB+	40万+
671b	6710亿	404GB	高性能、多核CPU，建议多台服务器配置	多个A100/V100显卡	512GB+	2TB+	200万+

选哪种类型的 DeepSeek-R1 模型，就得看看自己的电脑配置和钱包，也得看你的实际应用场景：

如果只是简单的文本处理、学习用途或者小型应用，选 1.5b、7b、8b 就够了。
如果要生成高质量文本、中型应用，推荐使用 14b 及以上的型号。
如果是企业级应用、大型应用，就必须上 32b、70b、671b 型号。

作者：Ddd4j 创建时间：2025-02-07 10:26
最后编辑：Ddd4j 更新时间：2026-02-27 09:37