- 博客(7)
- 收藏
- 关注
原创 语音唤醒相关
和唤醒相关的关键词wake-up word recognition / detection / spotting、voice triggering、voice activation、keyword spotting。其中keyword spotting主要用来待指【关键词检索】任务,有时也用来指语音唤醒,「关键词检索」与「语音唤醒」不同,它是在事先录制好的大量语音中搜索特定的关键词。这是一个离线任务,所以并不需要实时进行语音识别,也可以建立索引以加速检索。tips:掌握关键词是快速入门一个领域好方法,
2021-06-23 17:54:59 1255
原创 sed和awk使用
sed主要用于删除和替换文本,awk主要用于过滤和增加文本。sed按行执行,awk按列执行简述在以下的文章中会介绍使用 linux sed 命令删除和替换文件中指定字符的 20 个例子。sed 替换字符的命令格式 如下:$ sed 's/find/replace/' file示例文件:$ cat fileLinuxSolarisUbuntuFedoraRedHat 1. 删除指定的字符,比如 ‘a’$ sed 's/a//' fileLinuxSolrisUbuntuFe
2021-06-18 14:28:01 777
原创 python split方法
描述split() 通过指定分隔符对字符串进行切片,如果第二个参数 num 有指定值,则分割为 num+1 个子字符串。语法split() 方法语法:str.split(str="", num=string.count(str))参数str – 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。num – 分割次数。默认为 -1, 即分隔所有。返回值返回分割后的字符串列表。实例line = ‘2512-157242-0002 HE WAS GLAD THAT MOT
2021-06-11 15:56:57 561 1
原创 vocab生成
在nlp或者asr任务中,通常都需要根据corpus创建词典,并将单词在词典中的位置进行映射。词典中词可以是单个字也可以是字符,需要根据具体应用进行处理,一般在端到端asr任务中,vocab中单位都是字。首先我们拿到的标注文本一般是这样的MDT_F2F_223_158.wav 反正,呃对还有两台平板,然后高中的时候学校不给带手机我们都借他的手机用,他的手机真的借遍了全班MDT_F2F_223_159.wav 那会儿我有一次问他,我说我想借你的苹果四,他说哦,那台就或者是json文件, 一个json
2021-06-02 14:23:18 2483 1
原创 visual-speech
import IPython.display as ipdwave_sample= ipd.Audio(audio)wave_sampleimport matplotlib.pyplot as pltimport librosa.displayx,sr=librosa.load(audio)plt.figure(figsize=(14,5))librosa.display.waveplot(x,sr=sr)X = librosa.stft(x) #短时傅里叶变换Xdb=libro
2021-06-01 16:19:25 106
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人