语音识别

1、语音识别的基本架构

W=arg maxwP(W|Y)=arg maxwP(Y|W)P(W)P(Y)P(Y|W)P(W) W ∗ = a r g   m a x w P ( W | Y ) = a r g   m a x w P ( Y | W ) P ( W ) P ( Y ) ≈ P ( Y | W ) P ( W )

  WY1Baye Rule233     上 式 中 W 表 示 文 字 序 列 , Y 表 示 语 音 输 入 。 公 式 1 表 示 语 音 识 别 的 目 标 是 在 给 定 语 音 输 入 的 情 况 下 , 找 到 可 能 性 最 大 的 文 字 序 列 。 根 据 B a y e ′   R u l e , 可 以 得 到 公 式 2 , 其 中 分 母 表 示 出 现 这 条 语 音 的 概 率 , 它 相 比 于 求 解 的 文 字 序 列 没 有 参 数 关 系 , 可 以 在 求 解 时 忽 略 , 进 而 得 到 公 式 3 。 公 式 3 中 第 一 部 分 表 示 给 定 一 个 文 字 序 列 出 现 这 条 音 频 的 概 率 , 它 就 是 语 音 识 别 中 的 声 学 模 型 ; 第 二 部 分 表 示 出 现 这 个 文 字 序 列 的 概 率 , 它 就 是 语 音 识 别 中 的 语 言 模 型 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值