之前按照CSDN上的教程顺利安装成功了,有没下载成功的包,进行替换等步骤,后面卸载了重装,就跟第一次装的不一样了。git clone 顺利下载了全部的包。但到下面这一步:
在 ./src/ 进行
make -j 4
一直报这个错误,找了很多方法都没有解决
#$ ptxas -arch=sm_30 -m64 --generate-line-info "/tmp/tmpxft_00003d59_00000000-11_cu-kernels.compute_30.ptx" -o "/tmp/tmpxft_00003d59_00000000-14_cu-kernels.compute_30.cubin" ptxas fatal : Value 'sm_30' is not defined for option 'gpu-name' # --error 0xff -- Makefile:32: recipe for target 'cu-kernels.o' failed make[1]: *** [cu-kernels.o] Error 255 make[1]: 离开目录“/home/user2/kaldi/src/cudamatrix” Makefile:164: recipe for target 'cudamatrix' failed make: *** [cudamatrix] Error 2 make: *** 正在等待未完成的任务.... c++ -std=c++14 -I.. -isystem /home/user2/kaldi/tools/openfst-1.7.2/include -O1 -Wall -Wno-sign-compare -Wno-unused-local-typedefs -Wno-deprecated-declarations -Winit-self -DKALDI_DOUBLEPRECISION=0 -DHAVE_EXECINFO_H=1 -DHAVE_CXXABI_H -DHAVE_MKL -I/opt/intel/mkl/include -m64 -msse -msse2 -pthread -g -fPIC -DHAVE_CUDA -I/usr//include -fPIC -pthread -isystem /home/user2/kaldi/tools/openfst-1.7.2/include -c -o hmm-test-utils.o hmm-test-utils.cc
后面找英文的,找到了一个自动安装的方法很快就装好,太厉害了这个博主,这是原博文。
Kaldi Speech Recognition for Beginners - A Simple Tutorial
在本教程中,我们将使用开源语音识别工具包Kaldi 结合 Python 来自动转录音频文件。在本教程结束时,您将能够通过一个简单的命令在几分钟内获得转录!
重要的提示
在本教程中,我们使用Ubuntu 20.04.03 LTS (x86_64 ISA)。如果您使用的是 Windows,建议的过程是安装虚拟机并在基于 Debian 的发行版上完全按照本教程进行操作(最好是上面提到的发行版 - 您可以在此处找到 ISO )
在开始使用 Kaldi 进行语音识别之前,我们需要执行一些安装。
装置
先决条件
最显着的先决条件是时间和空间。Kaldi 安装可能需要几个小时,并消耗近 40 GB 的磁盘空间,因此请做好相应准备。如果您需要尽快转录,请查看云语音转文本 API部分!
自动安装
如果您想手动安装 Kaldi 及其依赖项,可以继续下一小节。如果您对自动安装感到满意,则可以按照本小节进行操作。
您需要将wget
其git
安装在您的计算机上才能继续操作。wget
大多数 Linux 发行版上都已原生安装,但您可能需要打开终端并git
使用
(base) ryan@ubuntu : ~ $ sudo apt install git-all |
接下来,导航到要安装 Kaldi 的目录,然后使用以下命令获取安装脚本
(base) ryan@ubuntu : ~ $ wget https://raw.githubusercontent.com/AssemblyAI/kaldi-asr-tutorial/master/setup.sh |
此命令下载setup.sh文件,该文件实际上只是自动执行下面的手动安装。请务必在文本编辑器中打开此文件并检查它,以确保您理解它并且可以轻松运行它。然后您可以使用以下命令执行设置
(base) ryan@ubuntu : ~ $ sudo bash setup.sh |
运行上述命令将安装 Kaldi 的所有依赖项,然后安装 Kaldi 本身。您将需要确认所有依赖项均已在某一时刻安装(安装几分钟后)。我们建议检查并确认,但如果您正在安装全新的 Ubuntu 20.04.03 LTS(可能在虚拟机上),那么您可以通过运行来跳过确认
(base) ryan@ubuntu : ~ $ y | sudo bash setup.sh |
在这种情况下,您在安装过程中根本不需要与终端交互。安装可能需要几个小时,因此您可以离开并在安装完成后返回。安装完成后,进入项目目录
(基地) ryan@ubuntu : ~ $ cd ./kaldi/egs/kaldi-asr-tutorial/s5 |
然后继续转录音频文件。
然后进行测试
(base) u@com:~/data/kaldi/egs/yesno/s5$ ./run.sh
--2023-09-11 21:43:56-- http://www.openslr.org/resources/1/waves_yesno.tar.gz
正在解析主机 www.openslr.org (www.openslr.org)... 46.101.158.64
正在连接 www.openslr.org (www.openslr.org)|46.101.158.64|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 302 Found
位置:https://openslr.magicdatatech.com/resources/1/waves_yesno.tar.gz [跟随至新的 URL]
--2023-09-11 21:43:57-- https://openslr.magicdatatech.com/resources/1/waves_yesno.tar.gz
正在解析主机 openslr.magicdatatech.com (openslr.magicdatatech.com)... 39.96.249.211
正在连接 openslr.magicdatatech.com (openslr.magicdatatech.com)|39.96.249.211|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:4703754 (4.5M) [application/x-gzip]
正在保存至: “waves_yesno.tar.gz”
waves_yesno.tar.gz 100%[===================>] 4.49M 161KB/s 用时 40s
2023-09-11 21:44:37 (115 KB/s) - 已保存 “waves_yesno.tar.gz” [4703754/4703754])
waves_yesno/
结尾有这个,表示运行成功了
steps/diagnostic/analyze_lats.sh: see stats in exp/mono0a/decode_test_yesno/log/analyze_alignments.log
Overall, lattice depth (10,50,90-percentile)=(1,1,2) and mean=1.2
steps/diagnostic/analyze_lats.sh: see stats in exp/mono0a/decode_test_yesno/log/analyze_lattice_depth_stats.log
local/score.sh --cmd utils/run.pl data/test_yesno exp/mono0a/graph_tgpr exp/mono0a/decode_test_yesno
local/score.sh: scoring with word insertion penalty=0.0,0.5,1.0
%WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] exp/mono0a/decode_test_yesno/wer_10_0.0