2022.9.24 第2次周报-CSDN博客

本文链接：https://blog.csdn.net/wkh1314/article/details/127029680

本文提出了一种针对口吃语音的检测和校正算法，结合神经网络和字符串运算在MATLAB中实现。该系统创建了用户友好的GUI，能清除口吃，提高语音识别率。同时，学习了吴恩达的机器学习课程，重点了解了代价函数、梯度下降和线性回归。

摘要由CSDN通过智能技术生成

文献阅读

本周阅读了《Speech Recognition and Correction of a Stutterrd Speech》文献。

摘要

本文的目的是开发一种算法，以增强口吃的语音识别。口吃是一种疾病，通过非自愿重复，单词/音节的延长或非自愿的无声间隔影响语音流利。当前的语音识别系统无法识别口吃的语音。在文献中已经报道了检测口吃的方法，但是尚未报告有效的口吃校正技术。本文解决了此问题，并提出了在可接受的时间限制内检测和纠正口吃的方法。为了清除样品中的延长，开发了通过神经网络的幅度阈值。使用现有的文本对语音（TTS）系统通过字符串重复删除算法来删除重复。因此，对所有没有口吃输出信号，产生更好的语音识别。

研究内容及结论

在实时模式下检测和校正这些口吃语音样本，生成没有任何口吃的经过校正的语音样本。人们提出了一种使用神经网络和少量字符串运算的算法来检测和校正语音。这个系统可以与手机和笔记本电脑集成，帮助患有这种语言障碍的人用语音控制他们的设备，就像当今世界大多数人所作的那样。帮助言语残疾人使用他们已经可以使用的工具，而不用担心他们的言语障碍。

口吃的语音处理系统在MATLAB环境中实现。创建了一个用户友好的GUI，该GUI使用户能够记录自己的演讲，然后处理演讲以生成无序的语音，如下所示。GUI为用户提供了仅删除用户语音中的延长或所有类型口吃的选项。这里讨论的斯托特的类型是部分或全词的重复，延长和插入。
图1(a) 从用户语音样本中删除所有类型的口吃

图1(b) 去除用户语音样本中的延长