《Automatic Proofreading in Chinese: Detect and Correct Spelling Errors in Character-level》baseline实现

最新推荐文章于 2024-08-15 13:39:06 发布

QiufengWang424

最新推荐文章于 2024-08-15 13:39:06 发布

阅读量749

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guhaiteng/article/details/80209190

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

基础知识&原理

MEM(MaximumEntropy Method),即最大熵模型

平滑算法解释：平滑算法具体分差值(Interpolation) 和回退(backoff)这两个思想

Katz smoothing实现

对MEM正则化的解释：
采用最大似然方法训练出的最大熵模型能够在训练数据上表现良好，但是不一定在未知数据上具有好的推广性。特别是出现在参数数量巨大而训练数据又不是很充足的情况下。一种解决方案是设立一定数量的开发集，当在开发集上性能下降时停止训练。但是这并不是一个很好的策略，因为可能暂时的下降之后还会上升。
另一种思路就是在优化目标上改变，可以增加关于参数的先验知识，也被称为一种“正则化”的策略。设定我们的参数集为w，训练样本集合为D，那么根据贝叶斯公式有：
其中，成为给定D下参数w的后验，成为w在D上的似然，称为w的先验。最大似然轨迹其实就是假设w的先验为均匀分布，直接最大化似然就可以了。
而我们可以通过假设一个先验分布，来防止有些权值被过训练，一个常用的分布就是高斯分布。

相关代码实现：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。