语音识别
奔跑熊
个人对图像处理,机器学习,深度学习等领域比较感兴趣,欢迎多交流!
展开
-
windows下写入文本换行符\r\n修改为linux下换行符\n
最近一段时间经常使用python向文本写入数据,但是windows下换行符默认为\r\n,而linux下换行符为\n,写入的文本要在linux下调用,这就很坑人了,代码前行的路上怎么能被小小石头绊倒,于是乎搜索了一通,发现这个事情仅需要几行代码就搞定。with open('input.txt', 'rU') as infile, \ open('output.txt', 'w', newline='\n') as outfile: outfile.原创 2020-06-03 21:29:04 · 1754 阅读 · 0 评论 -
音频文件采样率转换
现在音频文件的采样率比较多样,在数据处理的时候一般需要转换到同一采样率下才能进行进一步的处理。自己也是在数据处理的过程中需要进行采样率转换,在网上搜了一通,然而并没有啥可用的东西,下面提供一个基于python实现的音频采样率转换的脚本。def rateTransfer(src_file,new_path): ''' src_file: 原始存放音频文件的文件夹 new_path: 更改采样率后存放音频文件的文件夹 ''' sampleRate,D...原创 2020-06-01 14:52:51 · 3229 阅读 · 0 评论 -
DTW的具体实现
DTW在很多领域都有其具体应用,主要用于模板匹配,如孤立词语音识别,计算机视觉中行为识别,信息检索等。最近在做语音这块的研究,于是深入分析了下DTW的具体实现过程,其实DTW的实现过程就是一个利用动态规划思想寻找最有路径。相关理论知识本来打算自己写一篇,网上查了下不得不佩服大神的杰作,所以这里自己就不再详述理论了,因为大神的佳作还是比较难超越。理论知识可以参考:(1)https://www.cnb...原创 2019-10-09 17:52:12 · 2587 阅读 · 5 评论
分享