bitsandbytes 项目推荐
bitsandbytes 8-bit CUDA functions for PyTorch 项目地址: https://gitcode.com/gh_mirrors/bi/bitsandbytes
1. 项目基础介绍和主要编程语言
bitsandbytes 是一个轻量级的 Python 库,主要用于 PyTorch 中的大规模语言模型(LLM)的 k-bit 量化。该项目的主要编程语言是 Python,同时也包含一些 CUDA、C++ 和 Shell 脚本。
2. 项目的核心功能
bitsandbytes 的核心功能包括:
- 8-bit 优化器:提供高效的 8-bit 优化器,显著减少内存占用和计算开销。
- 矩阵乘法(LLM.int8()):支持 8-bit 矩阵乘法,适用于大规模语言模型的推理和训练。
- 8-bit 和 4-bit 量化:提供 8-bit 和 4-bit 量化功能,通过
bitsandbytes.nn.Linear8bitLt
和bitsandbytes.nn.Linear4bit
实现。 - 多硬件支持:正在开发对 Intel CPU、AMD GPU、Apple Silicon 等硬件的支持。
3. 项目最近更新的功能
最近更新的功能包括:
- 多后端重构:正在进行复杂的多后端重构,以支持除 CUDA 之外的其他硬件后端,如 AMD GPU 和 Intel CPU/GPU。
- Mac 支持:Mac 支持的开发也在进行中,预计未来会有更多进展。
- 夜间发布:计划启用夜间发布,以简化用户从源代码编译的过程。
- 社区反馈:鼓励用户在 GitHub 讨论区提供反馈,帮助项目进一步完善。
通过这些更新,bitsandbytes 正在逐步扩展其硬件兼容性和功能,使其在大规模语言模型的量化和优化方面更加强大和灵活。
bitsandbytes 8-bit CUDA functions for PyTorch 项目地址: https://gitcode.com/gh_mirrors/bi/bitsandbytes