零基础入门语音识别-食物声音识别Task6

最新推荐文章于 2021-07-28 16:31:12 发布

miskirito

最新推荐文章于 2021-07-28 16:31:12 发布

阅读量255

点赞数

分类专栏：自主学习 Datawhale组队学习笔记文章标签：语音识别

本文链接：https://blog.csdn.net/weixin_57171836/article/details/116034940

版权

自主学习同时被 2 个专栏收录

29 篇文章 2 订阅

订阅专栏

Datawhale组队学习笔记

27 篇文章 0 订阅

订阅专栏

零基础入门语音识别-食物声音识别

Task6 语音识别基础知识介绍

本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛。
baseline由开源学习组织Datawhale提供
https://github.com/datawhalechina/team-learning

不知不觉，这次学习的尾声已经到来，在进行最后的学习总结前，我先回顾了一边此前学习的内容。

零基础入门语音识别-食物声音识别Task1
零基础入门语音识别-食物声音识别Task2
零基础入门语音识别-食物声音识别Task3
零基础入门语音识别-食物声音识别Task4
零基础入门语音识别-食物声音识别Task5

语音识别基础与发展

其实，在日常生活里，语音识别的应用已经十分多样，听歌识曲、语言识别，声纹解锁等功能让声音的力量更进一步。

语音识别基础

语音识别全称为“自动语音识别”，Automatic Speech Recognition (ASR), 一般是指将语音序列转换成文本序列。语音识别最终是统计优化问题，给定输入序列O={O1,…,On}，寻找最可能的词序列W={W1,…,Wm}，即寻找使得概率P(W|O)最大的词序列。用贝叶斯公式表示为：
在这里插入图片描述
其中P(O|W) 叫做声学模型，描述的是给定词W时声学观察为O的概率；P(W)叫做语言模型，负责计算某个词序列的概率；P(O)是观察序列的概率，是固定的，是固定的，所以只看分母部分即可。