哔哩哔哩聊天机器人 bilibot
教程
1. 项目介绍
bilibot
是一个基于哔哩哔哩(B站)用户评论数据微调训练的本地聊天机器人。它支持文字交互,并且可以通过特定的问题文本生成语音对话。项目采用Qwen1 5-32B-Chat作为基础模型,并利用苹果的mlx-lm LORA技术进行模型微调。此外,它还集成了GPT-SoVITS项目来实现语音生成功能。
2. 项目快速启动
安装环境
确保已安装Python 3.10,推荐使用Anaconda管理环境:
conda create -n bilibot python=3.10
conda activate bilibot
在创建的环境中安装依赖:
cd bilibot
pip install -r requirements.txt
模型微调与测试
执行以下命令进行模型微调:
python -m mlx_lm lora --model models/Qwen1_5-32B-Chat --data data/ --train --iters 1000 --batch-size 16 --lora-layers 12
接着,合并微调后的适配器文件:
python -m mlx_lm fuse --model models/Qwen1_5-32B-Chat --save-path models/Qwen1_5-32B-Chat-FT --adapter-path models/Qwen1_5-32B-Chat-Adapters
然后,进行模型量化解压以提高效率:
python tools/compress_model.py
最后,运行chat.py
进行对话测试:
python chat.py
语音生成
首先,按照GPT-SoVITS官方指南设置环境并运行语音生成程序。
conda create -n GPTSOVITS python=3.9
conda activate GPTSOVITS
cd GPT-SoVITS
pip install -r requirements.txt
python webui.py
运行API服务(9880端口为派蒙,9881端口为林亦):
python api.py -s
3. 应用案例和最佳实践
- 客户服务:将
bilibot
集成到客服系统中,以提供自动回复和常见问题解答。 - 社区互动:在论坛或社交媒体上作为智能助手参与讨论,增强用户体验。
- 个性化学习助手:通过定制问答模式,帮助学生解决学术难题。
- 情感分析:利用模型对用户情绪进行分析,改进产品体验。
4. 典型生态项目
- Qwen: 基础语言模型,用于
bilibot
的文字生成。 - mlx-lm: 苹果提供的LORA模型微调工具。
- GPT-SoVITS: 开源语音合成项目,与
bilibot
结合实现语音交流。 - Anaconda: Python环境管理工具,简化了环境搭建过程。
本教程提供了从零开始使用bilibot
的基本步骤,通过上述操作,你可以快速地构建一个能够理解和回应用户对话的聊天机器人。在实际应用中,可以根据需求调整参数,进一步优化模型性能。