7. Flux量化版本使用和下载

最新推荐文章于 2025-04-02 17:22:40 发布

alberic_k

最新推荐文章于 2025-04-02 17:22:40 发布

阅读量2.6k

点赞数 23

文章标签：计算机视觉人工智能 AI作画 stable diffusion

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40964597/article/details/143420091

版权

1. 量化介绍

大模型量化是一种减少机器学习模型存储和计算需求的技术。模型的大小由其参数量及其精度决定，精度通常为float32(FP32)、float16(FP16)或bfloat16(BF16)。在训练的时候，为了保证精度会用较高的精度如FP32，推理的时候FP16权重通常能够达到与FP32相似的精度，故可以通过量化技术将模型中的浮点数权重和激活值转换更低精度的表示。

2.Flux三类量化模型 FP、GGUF、NF4

2.1 FP

请添加图片描述
最直接的量化方式，通过降低参数精度的方式减少模型体积。在Huggingface上可以搜到较多的结果。但是这种方式过低的精度会导致较差的结果，而FP8也需要16G左右的显存空间。所以本文不过多介绍FP相关的内容，如有需要模型可私聊下载。
请添加图片描述

2.2 GGUF

请添加图片描述
目前使用最广泛的方式，由City96大佬在Huggingface上

最低0.47元/天解锁文章

博客等级

码龄8年

17
原创

118
点赞

149
收藏

87
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: UnetLoaderGGUF `newbyteorder` was removed from the ndarray class in NumPy 2.0. Use `arr.view(arr.dty

下一篇：: AI音乐声音克隆实操--用海绵宝宝的声音唱歌(Replay +RVC)

最新评论

官方Flux版本介绍及下载
跳进黑洞: 请问这到底需要哪些文件呢？想要把FLUX Github仓库里的代码跑起来的话。
关于伯乐框架(RecBole)某些模型不能调控GPU解决方案
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题非常吸引人，内容也很有深度。对于伯乐框架(RecBole)中某些模型不能调控GPU的问题，您给出了解决方案，这对其他使用该框架的用户来说一定非常有帮助。不过，如果可能的话，我认为您可以进一步探讨一些在GPU调控方面的技术细节，或者分享一些您在实践中的经验教训。这样可以为读者提供更多的参考和实用的建议。希望您能继续保持创作，并期待看到更多精彩的博客文章！
Windows10作为Redis server无法连接
CSDN-Ada助手: 恭喜您又发表了一篇有用的博客，对于遇到Windows10作为Redis server无法连接的问题，您的经验分享一定会帮助到很多人。同时，建议您在下一步的创作中可以考虑深入探究Redis的其他应用场景或者与其他技术的结合使用。期待您的更多精彩分享。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
whisper部署与使用
CSDN-Ada助手: 恭喜你开始写博客啦！关于Whisper的部署与使用，你的经验分享一定能够帮助到很多人。希望你在写作过程中能够继续保持谦虚的态度，不断学习、探索更多有价值的技术主题，并分享给更多人。期待你的下一篇作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Mr.-Ranedeer 基于prompt的个性化教学导师
CSDN-Ada助手: 恭喜您写出了这篇有趣的博客，很高兴看到您能够利用 prompt 实现个性化教学导师。我认为您可以考虑进一步扩展这个项目，比如增加更多的交互功能或者加入人工智能算法，以提供更优质的教学体验。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。