- 博客(7)
- 收藏
- 关注
原创 语音唤醒相关
和唤醒相关的关键词 wake-up word recognition / detection / spotting、voice triggering、voice activation、keyword spotting。 其中keyword spotting主要用来待指【关键词检索】任务,有时也用来指语音唤醒,「关键词检索」与「语音唤醒」不同,它是在事先录制好的大量语音中搜索特定的关键词。这是一个离线任务,所以并不需要实时进行语音识别,也可以建立索引以加速检索。 tips:掌握关键词是快速入门一个领域好方法,
2021-06-23 17:54:59 1255
原创 sed和awk使用
sed主要用于删除和替换文本,awk主要用于过滤和增加文本。sed按行执行,awk按列执行 简述 在以下的文章中会介绍使用 linux sed 命令删除和替换文件中指定字符的 20 个例子。sed 替换字符的命令格式 如下: $ sed 's/find/replace/' file 示例文件: $ cat file Linux Solaris Ubuntu Fedora RedHat 1. 删除指定的字符,比如 ‘a’ $ sed 's/a//' file Linux Solris Ubuntu Fe
2021-06-18 14:28:01 777
原创 python split方法
描述 split() 通过指定分隔符对字符串进行切片,如果第二个参数 num 有指定值,则分割为 num+1 个子字符串。 语法 split() 方法语法: str.split(str="", num=string.count(str)) 参数 str – 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。 num – 分割次数。默认为 -1, 即分隔所有。 返回值 返回分割后的字符串列表。 实例 line = ‘2512-157242-0002 HE WAS GLAD THAT MOT
2021-06-11 15:56:57 561 1
原创 vocab生成
在nlp或者asr任务中,通常都需要根据corpus创建词典,并将单词在词典中的位置进行映射。词典中词可以是单个字也可以是字符,需要根据具体应用进行处理,一般在端到端asr任务中,vocab中单位都是字。 首先我们拿到的标注文本一般是这样的 MDT_F2F_223_158.wav 反正,呃对还有两台平板,然后高中的时候学校不给带手机我们都借他的手机用,他的手机真的借遍了全班 MDT_F2F_223_159.wav 那会儿我有一次问他,我说我想借你的苹果四,他说哦,那台就 或者是json文件, 一个json
2021-06-02 14:23:18 2485 1
原创 visual-speech
import IPython.display as ipd wave_sample= ipd.Audio(audio) wave_sample import matplotlib.pyplot as plt import librosa.display x,sr=librosa.load(audio) plt.figure(figsize=(14,5)) librosa.display.waveplot(x,sr=sr) X = librosa.stft(x) #短时傅里叶变换 Xdb=libro
2021-06-01 16:19:25 106
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人