Stable Diffusion 3.5发布:Stability AI 10月22日 发布了SD3.5版本
10月22日,Stability AI 发布了其最新的图像生成模型——Stable Diffusion 3.5。作为该系列的新一代产品,Stable Diffusion 3.5 不仅延续了前代模型的强大功能,还在性能、速度和硬件兼容性等方面进行了显著优化。
本次发布的模型包括三个主要版本:Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo 和即将于10月29日发布的 Stable Diffusion 3.5 Medium。
1. 多样化的模型版本,满足不同用户需求
针对不同的用户群体提供的不同的版本,三个版本的模型各有侧重:
- Stable Diffusion 3.5 Large:
这个版本拥有 80亿参数,能够生成高达 1兆像素 分辨率的图像,是目前该系列中最强大的一款。它在图像质量和提示词响应性上达到了行业领先水平,特别适合需要高质量输出的专业用户和企业。 - Stable Diffusion 3.5 Large Turbo:
相较于 Large 版本,Turbo 版本在速度方面有了极大提升。通过模型的“蒸馏”技术,Large Turbo 可以在 4步 内生成图像,这使其推理速度大幅提高。它的参数规模与 Large 相同,但在不牺牲图像质量的前提下,Turbo 版本为那些需要快速生成图像的用户提供了更高效的解决方案。 - Stable Diffusion 3.5 Medium:
Stable Diffusion 3.5 Medium 是一个适合普通用户的轻量级版本,拥有 25亿参数,专为消费级硬件优化。它能够生成分辨率介于 0.25至2兆像素 的图像,适合那些希望在家用电脑或笔记本上运行AI模型的用户。该版本虽然参数较少,但在质量和定制化方面仍然表现优异,特别适合个人创作和中小型企业。
2. 性能与优化
在性能优化方面,Stable Diffusion 3.5 通过一系列技术革新,显著提升了模型的生成速度与稳定性。特别是 Query-Key Normalization 技术的引入,使得模型在训练和推理时更加稳定,同时也简化了后续的微调和自定义过程。
对于图像生成模型而言,生成速度和提示词的响应性是衡量用户体验的重要指标。Stable Diffusion 3.5 Large 在这两方面的表现尤为出色,不仅在提示词的理解和执行上极为精准,还能够生成质量媲美更大规模模型的图像。而 Large Turbo 版本则通过减少生成步骤,大幅缩短了用户等待时间。
Stable Diffusion 3.5 Medium 作为一款轻量级模型,能够在消费级硬件上实现高效运行。
目前所有模型均在 Stability AI 社区许可协议 下发布,这一许可模式允许用户在非商业用途中免费使用模型,同时收入低于 100 万美元的企业也可以免费用于商业用途。
用户可以在 Hugging Face 上获取模型权重进行自托管,还可以通过 Stability AI API、Replicate、ComfyUI 和 DeepInfra 等平台访问这些模型。
尽管 Stable Diffusion 3.5 的发布让人充满期待,但在此之前,Stable Diffusion 3 Medium 的表现曾让部分用户感到失望,促使部分用户转向了如 FLUX 等新兴模型。因此,这次的 3.5 版本肩负着重新赢得市场和用户信任的重任。
Stability AI 已经宣布,他们将在 10 月 29 日之后推出更多功能,例如 ControlNets,这将为专业用户提供更多样化的控制功能,进一步提升图像生成的灵活性和精度。
- https://github.com/Stability-AI/sd3.5
- https://huggingface.co/stabilitya
Stability AI API
Replicate
ComfyUI
DeepInfra
-
宣小二:媒体发稿平台,AI驱动的企业自助式投放平台 2024-11-20 09:34:29
-
阿里国际入局AI Search,推出全球首个B2B AI搜索引擎Accio 2024-11-19 10:47:46
-
字节视频生成模型 PixelDance 上线即梦AI,用户可免费体验! 2024-11-19 10:42:06
-
网易云音乐创始人再创业,全灵SEELE获千万美元融资,瞄准全球首个AI游戏生成平台! 2024-11-19 10:39:43
-
智谱清流 - 智谱推出的企业级AI智能体平台 2024-11-18 11:43:33
-
可栗口语 - AI个性化英语口语学习平台 2024-11-18 11:42:09
-
AI绘本制作专业工具:ReadKidz(附:AI绘本怎么变现) 2024-11-18 11:40:22
-
Qwen2.5-Coder:程序员的开源AI神器,一文看懂阿里巴巴新一代代码生成模型 2024-11-18 10:51:04
-
AI巨头纷争:马斯克、哈萨比斯与奥特曼的恩怨情仇 2024-11-18 10:46:53
-
OpenAI正式发布Windows版ChatGPT 2024-11-16 12:10:30
-
Mac 版 ChatGPT 应用现在可以与 Xcode等编码应用集成 2024-11-16 12:08:10
-
CogSound让视频“声”动起来,从此告别无声尴尬! 2024-11-11 17:33:34
-
谷歌推出AI视频制作神器Vids:输入文字秒变视频,小白也能轻松创作(含:官网地址) 2024-11-11 17:30:57
-
Suno发布V4音乐生成模型音频演示视频(附:Suno简介与官网地址) 2024-11-11 17:28:17
-
Anthropic发布新型token计数API,支持多种Claude模型 2024-11-11 17:24:00
-
DimensionX单图生成3D/4D场景:告别建模苦恼 2024-11-11 17:20:28
-
豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真 2024-11-11 17:13:03
-
新闻机构起诉AI初创公司Perplexity:版权与技术的碰撞 2024-11-11 17:09:11
-
Luma AI 介绍(附:官网地址与团队介绍) 2024-11-07 11:18:23
-
Stable Diffusion 3.5:安装教程与模型解析 2024-11-06 10:20:11