(零基础语音识别task5)模型改进与优化2

这一篇承接上文,实际操作模型改进。
以task0的baseline为核心进行改进。
大概有几个方向是主要改进方向。

增加训练数量
扩大特征值范围
增加比较次数取均值(多次训练模型)

打算从改进模型训练方式进行调优,但是要先了解代码的意义(python基础不好QAQ)下图是baseline的计算数据特征函数的构造阶段

在这里插入图片描述
原先我并不知道fn的意义,用print之后
在这里插入图片描述
fn 代表的是训练集里的每一个数据。如果想用GAN来添加训练集从这里入手。

在这里插入图片描述
在后文的数据转换中(如上图),用transpose改变了temp 的序列?暂时不清楚意义。

这几天比较忙,暂时先到这里。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
语音识别的TensorFlow模型可以使用百度在PaddlePaddle上实现的Deepspeech2模型进行转换。这个模型在功能上非常强大。在TensorFlow中,可以使用一些功能来实现语音识别模型。具体的实现步骤可以参考以下目录中的文章: 1. 项目简介 2. 语音数据集介绍,包括不同人的声音、每个人不同单词的发音和声音波形 3. 代码功能介绍,包括依赖环境及项目目录、数据读取与预处理、语音数据分帧及mfcc处理、模型构建、模型训练、模型评估、模型训练可视化和模型预测 4. 代码下载地址 在TensorFlow中,可以使用自带的ctc_ops.ctc_beam_search_decoder()函数对网络输出进行解码,这种解码方式不使用外部的语言模型,输入为网络输出的logits和seq_length。如果需要带语言模型的解码,可以使用其他方法实现。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [基于tensorflow 的中文语音识别模型](https://blog.csdn.net/pelhans/article/details/81387472)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [手把手教你:基于TensorFlow的语音识别系统](https://blog.csdn.net/weixin_43486940/article/details/123866074)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值