基于Python的语音识别系统的设计与实现 毕业论文+演示视频+参考文献+项目源码及数据

!!! 有需要的小伙伴可以通过文章末尾名片咨询我哦!!!

 💕💕作者:小马
💕💕个人简介:混迹在java圈十年有余,擅长Java、微信小程序、Python、Android等,大家有这一块的问题可以一起交流!
💕💕各类成品java系统 。javaweb,ssh,ssm,springboot等等项目框架,源码丰富,欢迎咨询交流。学习资料、程序开发、技术解答、代码讲解、源码部署,需要请看文末联系方式。

The Design and Implementation of the Speech Recognition System Based on Python
Abstract
With the development of the Internet, voice files have become more and more accessible files.How to efficiently extract the key information from a recording, extract the content that people are interested in, and intuitively present it to the door.This paper takes DFSMN as an acoustic model and introduces the TensorFlowr model to transform speech recognition into a translation task, which has certain theoretical significance and research value.
This paper describes several mainstream deep learning models in the field of speech recognition.According to the deep learning theory, the overall scheme of the TensorFlow-based continuous speech learning system is designed.Focus on the shortcomings of speech feature extraction method and language model TensorFlow, and optimize the feature extraction method and language model.
For Mer frequency inversion coefficient characteristics (Mel Frequency Cepstrum Coefficient, MFCC) has the problem of weak speech information representation ability in the deep model, Introduce a log-Mayer filter group ((Log MelFilter-bank, Fbank) features combined with convolutional neural networks (Convolutional Neural Networks, CNN) The feature extraction method for reextraction, Combined with DFSMN to construct the acoustic model CNN-DFSMN, Realize the voice to pinyin task.The experimental results show that the feature extraction method of Fbank feature extraction has stronger representation ability and lower character error rate (Character Error Rate, CER).
An attention computational improvement method based on Hadamard matrix is proposed for the problems that language model TensorFlowr has complex computation and insufficient model generalization ability.This method uses the Hadamard matrix generated with different threshold values to generate a new attention matrix.Experimental results show that the improved TensorFlow model using the Hadmard matrix has both reduced recognition time and CER of the language model compared with the initial TensorFlowr model. Key words: Python, speech recognition, speech processing, TensorFlow, model

基于Python的语音识别系统的设计与实现
摘 要
随着互联网的发展,语音文件成为了人们接触得越来越多文件。如何高效的从一段录音中提取出关键信息,提取出其中人们感兴趣的内容,直观的呈现给人门。本文以DFSMN作为声学模型,引入TensorFlowr模型,将语音识别转化为翻译任务展开深入研究,具有一定的理论意义和研究价值。
本文阐述了语音识别领域的几种主流深度学习模型。根据深度学习理论,设计了基于TensorFlow的连续语音识别系统的总体方案。重点研究语音特征提取方法和语言模型TensorFlow的不足,对特征提取方法和语言模型进行优化。
针对梅尔频率倒谱系数特征(Mel Frequency Cepstrum Coefficient, MFCC)在深度模型里存在语音信息表征能力弱的问题,提出一种对数梅尔滤波组((Log MelFilter-bank, Fbank)特征结合卷积神经网络(Convolutional Neural Networks, CNN)再提取的特征提取方法,并和DFSMN结合构建声学模型CNN-DFSMN,实现语音转拼音任务。实验结果表明,Fbank特征结合CNN再提取的特征提取方法与其他特征提取方法相比,语音信息表征能力更强,模型的字符错误率(Character Error Rate, CER)更低。
针对语言模型TensorFlowr存在计算量复杂、模型泛化能力不足导致识别率不高,识别速度慢的问题,提出一种基于Hadamard矩阵的注意力计算改进方法。该方法利用设置不同阂值生成的Hadamard矩阵与注意力矩阵做点积,从而生成新的注意力矩阵。实验结果表明,利用Hadmard矩阵改进后的TensorFlow模型与初始TensorFlowr模型相比,语言模型的识别时间和CER都有所降低。

目  录
1 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.2.1 语音识别中声学模型研究现状 2
1.2.2 语音识别中语言模型研究现状 3
1.3 主要研究内容 4
2 语音识别系统需求分析 5
2.1 商务需求 5
2.2 教育需求 6
2.3 刑侦需求 6
2.4 国家安全需求 6
3 语音识别系统方案设计 8
3.1 语音信号的预处理 8
3.2 语音识别系统的分类 8
3.2.1 基于概率模型的语音识别系统 8
3.2.2 端到端语音识别系统 9
3.3 语音特征的提取 9
3.4 语音模型的构建 10
4 语音识别系统实现 12
4.1 系统介绍 12
4.2 语音数据集介绍 12
4.2.1 不同人的声音 12
4.2.2 每人不同单词的发音 12
4.2.3 声音波形 13
4.3 代码功能实现 13
4.3.1 项目思路 13
4.3.2 依赖环境及代码目录 13
4.3.3 数据读取与预处理(data_create.py) 14
4.3.4 语音数据分帧及mfcc处理(data_create.py) 15
4.3.5 模型构建(model.py) 16
4.3.6 模型训练(model_train.py) 20
4.3.7 模型评估(model_test.py) 20
4.3.8 模型训练可视化 21
4.3.9 模型预测(func_test.py) 22
结  论 25
致  谢 26
参考文献 27

更多项目:

另有1000+份项目源码,项目有java(包含springboot,ssm,jsp等),小程序,python,php,net等语言项目。项目均包含完整前后端源码,可正常运行!

!!! 有需要的小伙伴可以点击下方链接咨询我哦!!!

  • 25
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
设计实现Python基于OpenCV的疲劳检测系统包括源码数据库和说明文档。 首先,源码部分主要包括以下几个模块: 1. 数据采集模块:使用OpenCV库进行摄像头视频的采集和每帧图像的处理。 2. 眼睛检测模块:使用Haar Cascade分类器来检测人眼的位置和状态。 3. 眼睛状态检测模块:通过计算眼睛的高宽比例、瞳孔的颜色变化等指标来判断眼睛是否疲劳。 4. 疲劳检测模块:根据眼睛状态判断疲劳程度,并触发警报功能。 5. 用户界面模块:提供一个简单的图形用户界面,用于系统的操作、参数设置和实时显示结果。 其次,数据库部分用于存储疲劳检测系统的相关数据,包括用户的登陆信息、历史记录、警报记录等。 最后,说明文档应包含以下内容: 1. 系统的整体设计思路和流程:包括每个模块的功能和相互间的关系。 2. 源码文件的介绍:列出每个源码文件的作用和关系,以及如何编译和运行系统。 3. 采集和处理图像的方法和算法:详细说明如何使用OpenCV库来进行图像采集和处理,包括眼睛位置检测和状态判断的方法。 4. 数据库的设计和使用:介绍数据库的结构和表的设计,以及如何使用数据库来存储和查询相关数据。 5. 用户界面的设计和操作:说明系统的用户界面的设计思路和操作方式。 综上所述,Python基于OpenCV的疲劳检测系统设计实现包括源码数据库和说明文档,通过图像采集和处理、眼睛状态检测、疲劳判断和警报等模块实现疲劳检测功能,并使用数据库来存储相关数据,最后通过说明文档进行系统的介绍和操作说明。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员小马软件开发定制

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值