零基础语音识别
文章平均质量分 63
对语音识别的学习心得
wensaaaa
这个作者很懒,什么都没留下…
展开
-
零基础入门语音识别-食物语音识别Task06
本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零基础入门语音识别-食物声音识别挑战赛。baseline及用图由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning语音识别基础与发展语音识别的基础语音识别全称为“自动语音识别”,Automatic Speech Recognition (ASR), 一般是指将语音序列转换成文本序列。语音识别最终是统计优化问题,给定输入序列O={O1,…,On}原创 2021-04-23 00:14:32 · 136 阅读 · 0 评论 -
零基础入门语音识别-食物语音识别Task05
本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零基础入门语音识别-食物声音识别挑战赛。baseline及用图由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning过拟合和欠拟合过拟合和欠拟合概念过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。降低过拟合风险的方法(1原创 2021-04-22 00:29:52 · 120 阅读 · 0 评论 -
零基础入门语音识别-食物语音识别Task04
本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零基础入门语音识别-食物声音识别挑战赛。baseline及用图由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning深度学习模型搭建Task04的学习主要是深度学习如何搭建CNN网络结构。在进行Task01的学习中,我就曾经在b站的视频以及这次学习赛的直播课中对CNN卷积神经网络有了初步的了解学习。那么Task04就是学习如何用Python运用并建原创 2021-04-19 15:35:18 · 103 阅读 · 0 评论 -
零基础入门语音识别-食物语音识别Task03
对音频数据的特征提取在Task02中,通过课程学习到了如何将音频做基本处理,将其可视化。这次Task03的学习就是对这些音频数据再进一步处理,过滤掉背景噪音等不需要的信息,筛选出需要的信息。常见的音频特征提取分别有:·过零率 (Zero Crossing Rate)·频谱质心 (Spectral Centroid)·声谱衰减 (Spectral Roll-off)·色度频率 (Chroma Frequencies)·梅尔频率倒谱系数 (Mel-frequency cepstral coeff原创 2021-04-17 21:58:30 · 148 阅读 · 0 评论 -
零基础入门语音识别-食物语音识别Task02
学习对数据的探索本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零基础入门语音识别-食物声音识别挑战赛。baseline及用图由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning这次比赛的赛题任务是对食物的声音进行数据建模,准确分类。Python中有一些很棒的音频处理库,比如Librosa和PyAudio,还有一些内置的模块用于处理音频的基本处理。# 基本库import pandas原创 2021-04-16 00:25:05 · 190 阅读 · 0 评论 -
零基础入门语音识别-食物声音识别Task01
零基础入门语音识别学习Task01本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零基础入门语音识别-食物声音识别挑战赛。baseline及用图由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning对天池比赛的熟悉作为一个第一次参赛,并且对Python学习得并不透彻的小白,目前仅能做到的是跟着团队按照学习任务在天池先跑一边程序。通过天池的教程学习以及队友的帮助,能够成功地跑通程序,并按照流程,原创 2021-04-14 11:24:12 · 222 阅读 · 1 评论