2021年06月_ai-ai360

原创语音唤醒相关

和唤醒相关的关键词 wake-up word recognition / detection / spotting、voice triggering、voice activation、keyword spotting。其中keyword spotting主要用来待指【关键词检索】任务，有时也用来指语音唤醒，「关键词检索」与「语音唤醒」不同，它是在事先录制好的大量语音中搜索特定的关键词。这是一个离线任务，所以并不需要实时进行语音识别，也可以建立索引以加速检索。 tips:掌握关键词是快速入门一个领域好方法，

2021-06-23 17:54:59 1255

原创 sed和awk使用

sed主要用于删除和替换文本，awk主要用于过滤和增加文本。sed按行执行，awk按列执行简述在以下的文章中会介绍使用 linux sed 命令删除和替换文件中指定字符的 20 个例子。sed 替换字符的命令格式如下： $ sed 's/find/replace/' file 示例文件： $ cat file Linux Solaris Ubuntu Fedora RedHat 1. 删除指定的字符，比如 ‘a’ $ sed 's/a//' file Linux Solris Ubuntu Fe

2021-06-18 14:28:01 777

原创 python split方法

描述 split() 通过指定分隔符对字符串进行切片，如果第二个参数 num 有指定值，则分割为 num+1 个子字符串。语法 split() 方法语法： str.split(str="", num=string.count(str)) 参数 str – 分隔符，默认为所有的空字符，包括空格、换行(\n)、制表符(\t)等。 num – 分割次数。默认为 -1, 即分隔所有。返回值返回分割后的字符串列表。实例 line = ‘2512-157242-0002 HE WAS GLAD THAT MOT

2021-06-11 15:56:57 561 1

原创 ml_2021_hw3

2021-06-09 17:02:30 443

原创 asr评测指标

2021-06-03 15:51:03 398

原创 vocab生成

在nlp或者asr任务中，通常都需要根据corpus创建词典，并将单词在词典中的位置进行映射。词典中词可以是单个字也可以是字符，需要根据具体应用进行处理，一般在端到端asr任务中，vocab中单位都是字。首先我们拿到的标注文本一般是这样的 MDT_F2F_223_158.wav 反正，呃对还有两台平板，然后高中的时候学校不给带手机我们都借他的手机用，他的手机真的借遍了全班 MDT_F2F_223_159.wav 那会儿我有一次问他，我说我想借你的苹果四，他说哦，那台就或者是json文件，一个json

2021-06-02 14:23:18 2485 1

原创 visual-speech

import IPython.display as ipd wave_sample= ipd.Audio(audio) wave_sample import matplotlib.pyplot as plt import librosa.display x,sr=librosa.load(audio) plt.figure(figsize=(14,5)) librosa.display.waveplot(x,sr=sr) X = librosa.stft(x) #短时傅里叶变换 Xdb=libro

2021-06-01 16:19:25 106

q_xiami123的博客