Stable Diffusion 3 终于开源了,2B参数的 Stable Diffusion 3 Medium 模型已经可以在HuggingFace上下载了:

https://huggingface.co/stabilityai/stable-diffusion-3-medium

Stable Diffusion 3 Medium 的参数量为2B,大小适中,它非常适合在消费级个人电脑和笔记本电脑上运行,同时也适用于企业级GPU。

SD3 Medium的优势如下所示:

  • 照片级真实感:克服了手部和面部常见的伪影问题,无需复杂的工作流程即可提供高质量的图像。

  • 提示词遵循性:理解涉及空间关系、构图元素、动作和风格的复杂提示。

  • 文字能力:借助Diffusion Transformer架构,在生成无伪影和拼写错误的文本方面取得了前所未有的成果。

  • 资源高效:由于其低VRAM占用,非常适合在标准消费级GPU上运行,且不降低性能。

  • 微调:能够从小数据集中吸收细微的细节,使其非常适合定制化。

另外,StabilityAI与NVIDIA合作,利用TensorRT来提升所有Stable Diffusion模型的性能,包括Stable Diffusion 3 Medium。经过TensorRT优化的版本,性能提升了50%,Stable Diffusion 3 Medium的TensorRT优化版本也将发布。

而且,AMD也已经针对包括AMD最新的APU、消费级GPU和MI-300X企业级GPU在内的各种AMD设备,对SD3 Medium的推理进行了优化。

除了模型之外,StabilityAI还直接放出了SD3的ComfyUI工作流:

实测comfyui上12GB显存就可以跑了:

作者:Jeebiz  创建时间:2024-07-09 12:25
最后编辑:Jeebiz  更新时间:2025-05-12 09:20