接上节,搭建好本地大模型后,只支持文字问答,所以需要对语音输入进行增强。
1、环境搭建
在CMD中执行下面的命令行,创建一个名为Paraformer的Conda虚拟环境,且Python版本为3.7
conda activate paraformer
pip install ffmpeg
pip install aiofiles
pip install fastapi
pip install urllib3==1.26.15
pip install minio
Pip install edge-tts
pip install python-multipart
1.安装阿里达摩院相关依赖,实现文字转语音。
pip install "modelscope" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
2.安装torch依赖,并且使用清华源加速。
pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple