DeepSeek-V3

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

一个强大的混合专家 (MoE) 语言模型,总共有 671B 个参数,每个标记激活 37B 个参数。

作者:Jeebiz  创建时间:2024-12-28 22:39
最后编辑:Jeebiz  更新时间:2025-05-12 09:20