Python深度学习婴儿啼哭声分类识别，测试集准确率67.5%

最新推荐文章于 2024-10-11 23:21:40 发布

tf_q568897492

最新推荐文章于 2024-10-11 23:21:40 发布

阅读量7.4k

点赞数 10

分类专栏：深度学习文章标签：深度学习 tensorflow 啼哭声分类啼哭声识别 Python

本文链接：https://blog.csdn.net/qq_34351067/article/details/111051180

版权

随着AI技术的发展，人工智能已在各行业中不断被应用。
正常新生儿一天至少哭3小时，但不同的哭声代表不同涵义，一般家长可能听不出来。
对婴儿来说，哭声是一种通讯的方式，一个非常有限的，但类似成年人进行交流的方式。它也是一种生物报警器，向外界传达着婴儿生理和心理的需求。基于啼哭声声波携带的信息，婴儿的身体状况才能被确定，疾病才能被检测出来。因此，有效辨识啼哭声，成功地将婴儿啼哭声“翻译”成“成人语言”，让我们能够读懂啼哭声的含义，有重大的实际意义。

数据集一共6类

每类随机抽取13个样本做为测试集总共73。

安装环境

!pip install matplotlib
!pip install soundfile
!pip install librosa
 
!pip install torchlibrosa
!conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

!apt-get update
!apt-get install libsndfile1

环境可以直接使用配置好的免费云gpu