轻松入门自然语言处理系列 专题6 代码实战──基于语言模型的拼写纠错

本文介绍了如何实现基于语言模型的拼写纠错,包括使用Noisy Channel Model,通过编辑距离获取候选集,利用词典和语言模型计算概率,以及在实际中的应用,如语音识别、机器翻译等。
摘要由CSDN通过智能技术生成

前言

本文主要介绍了代码实战,即基于语言模型的拼写纠错,包含任务描述、实现和语法纠错的应用。

一、拼写纠错任务概述

在实现QA系统或者检索系统时,需要用户给出输入,用户在输入问题的时候,不能期待他一定会输入正确,有可能输入的单词的拼写是错误的。在一个完备的系统中,需要后台能够及时捕获拼写错误,并进行纠正,然后再通过修正之后的结果再跟库里的问题进行匹配。这里来实现一个简单的拼写纠错模块,自动去修复错误的单词。

纠错模块是基于Noisy Channel Model噪音通道模型:

c ∗ = argmax ⁡ c ∈  candidates  p ( c

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI码东道主

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值