语音识别
郎郎不会飞
未来可期
展开
-
语音识别之实时语音互动
语音识别之进行实时语音互动今天心血来潮,利用百度API语音识别,用python尝试做了一下语音识别的小互动,感觉还不错,记录一下过程,分享一下。已经完成了互动的过程,你说一句它说一句,无奈不能上传视频,效果不明显。用到的东西呢主要的是利用百度API首先呢,需要拥有一个百度账号,登录百度智能云:https://ai.baidu.com/tech/speech,然后建立一个语音识别的应用。会...原创 2020-03-06 14:36:41 · 607 阅读 · 1 评论 -
语音识别之HTK重理解
语音识别之HTK重理解趁着没开学,今天把语音识别中的隐马尔可夫模型相关训练重新跑了一遍,结合网络大佬的经验,对HTK工具的继续运行深入理解,重新训练了数据,并结合实际进行了更新和完善。环境问题我就不说了,我默认已经是配置好的了。今天还是孤立词,内容呢是one,two,three,当然,后面自由发挥首先进行数据的采集rec -b 8 data/train/speech/01.wavre...原创 2020-02-15 14:25:52 · 460 阅读 · 0 评论 -
语音识别之HTK入门(五)结果显示
语音识别之HTK入门(五)结果显示一口气写完,不为别的,就怕自己忘了,这年纪大了,脑袋不记事,隔天就忘,记录下来,以备不时之需。我这里就用了一个测试音频,所以准确性大家自己来测吧,我只是验证一下操作的可行性。我是用了一个blue的音频,放在htk_color/data/test/speech/目录下,同样,对音频进行检测时,需要将wav文件转换成mfc文件在config目录下,建立codet...原创 2020-02-03 17:18:18 · 754 阅读 · 0 评论 -
语音识别之HTK入门(四)训练模型
语音识别之HTK入门(四)训练模型hmm0训练hmm0到hmm3hmm4的特殊训练hmm0训练生成proto和vFloors;HCompV -C ./config/config_color -f 0.01 -m -S ./config/train.scp -M ./hmm0 ./config/proto生成macros:perl scripts/makeMacros hmm0/vFloo...原创 2020-02-03 17:01:43 · 962 阅读 · 4 评论 -
语音识别之HTK入门(三)训练文件准备
语音识别之HTK入门(三)训练文件准备config文件夹下的操作lists文件夹下的操作dict文件夹操作labels文件夹操作scripts文件夹操作主目录树下的操作本节记录的是进行训练前的各种文件的准备,步骤稍微有些繁杂。config文件夹下的操作config文件夹下运行终端命令如下:touch grammertouch global.dedtouch mkphones_color...原创 2020-02-03 16:27:04 · 828 阅读 · 2 评论 -
语音识别之HTK入门(二)准备训练数据
语音识别之HTK入门(二)准备训练数据文件目录树构建语音数据采集识别过程是隐马尔可夫模型HMM进行的HTK说到底就是建立隐马尔可夫模型HMM过程中的工具,过程如下:M的工具,如下图:文件目录树构建构建一个目录框架,创建命令如下:mkdir -p htk_color/{config,data/{test/{mfc,speech},train/{mfc,speech}},dict,hmm0...原创 2020-02-03 15:03:41 · 730 阅读 · 0 评论 -
语音识别之HTK入门(一)HTK的下载配置
语音识别之HTK入门(一)HTK的下载配置Linux环境配置VMware Tools安装必备环境HTK下载HTK环境设置跪拜大佬帖子:https://www.cnblogs.com/ansersion/p/4155828.html基本按照大佬的帖子进行调试的,为表示敬意,全程跪着键盘。最近学习语音识别的相关知识,通过网上查找资料,很难找到与语音相关的代码实现与资料,一头雾水,头昏脑胀,通过...原创 2020-02-02 23:43:57 · 1506 阅读 · 1 评论