CRF

smartcat2010

于 2019-03-02 18:59:03 发布

阅读量208

收藏

点赞数

分类专栏：经典机器学习 NLP

原文链接：https://www.jiqizhixin.com/articles/2018-05-23-3

版权

NLP 同时被 2 个专栏收录

21 篇文章 1 订阅

订阅专栏

经典机器学习

16 篇文章 1 订阅

订阅专栏

有讲解有代码例子：

CRF 将输出层面的关联分离了出来

Softmax将序列标注看成是 n 个 k 分类问题，CRF将序列标注看成是 1 个 k^n 分类问题

打分函数取softmax就得到概率

计算归一化因子（所有路径的总概率），预测Viterbi, 都是用的动态规划。

讲解Tensorflow里的LSTM+CRF实现：

https://blog.csdn.net/u011724402/article/details/82078328

LSTM的softmax打分p（依赖于LSTM的网络参数）, 和label转移概率矩阵A, 是联合在一起训练的；训练目标函数就是最大化p(label序列y | LSTM最后一层输出序列x)

外层softmax的分母，是必须要计算的。

判别式模型和生成式模型-------------------------------------------------------

1. 判别式模型

那么A批模型对应了判别式模型。根据上面的两句话的区别，可以知道判别模型的特征了，所以有句话说：判别模型是直接对 P(Y|X) 建模，就是说，直接根据X特征来对Y建模训练。

具体地，我的训练过程是确定构件 P(Y|X) 模型里面“复杂映射关系”中的参数，完了再去inference一批新的sample。

所以判别式模型的特征总结如下：

对建模
对所有的样本只构建一个模型，确认总体判别边界
观测到输入什么特征，就预测最可能的label
另外，判别式的优点是：对数据量要求没生成式的严格，速度也会快，小数据量下准确率也会好些。

2. 生成式模型

同样，B批模型对应了生成式模型。并且需要注意的是，在模型训练中，我学习到的是X与Y的联合模型 P(X,Y) ，也就是说，我在训练阶段是只对 P(X,Y) 建模，我需要确定维护这个联合概率分布的所有的信息参数。完了之后在inference再对新的sample计算 P(Y|X) ，导出 ,但这已经不属于建模阶段了。

结合NB过一遍生成式模型的工作流程。学习阶段，建模： P(X,Y)=P(X|Y)P(Y) （当然，NB具体流程去隔壁参考）,然后 $P(Y|X) = \frac{P(X,Y)}{P(X)}$ 。
另外，LDA也是这样，只是他更过分，需要确定很多个概率分布，而且建模抽样都蛮复杂的。

所以生成式总结下有如下特点：

对建模
这里我们主要讲分类问题，所以是要对每个label（ $y_{i}$ ）都需要建模，最终选择最优概率的label为结果，所以没有什么判别边界。（对于序列标注问题，那只需要构件一个model）
中间生成联合分布，并可生成采样数据。
生成式模型的优点在于，所包含的信息非常齐全，我称之为“上帝信息”，所以不仅可以用来输入label，还可以干其他的事情。生成式模型关注结果是如何产生的。但是生成式模型需要非常充足的数据量以保证采样到了数据本来的面目，所以速度相比之下，慢。

条件随机场（CRF）和隐马尔科夫模型（HMM）最大区别在哪里？

1.特征函数的选择: 特征函数的选取直接关系模型的性能。
2.参数估计: 从已经标注好的训练数据集学习条件随机场模型的参数，即各特征函数的权重向量λ。
3.模型推断: 在给定条件随机场模型参数λ下，预测出最可能的状态序列。

CRF介绍

如何轻松愉快地理解条件随机场（CRF）？

特征函数可以和label有关，也可以和输入有关。

smartcat2010

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

smartcat2010 CSDN认证博客专家 CSDN认证企业博客

码龄13年

暂无认证

211: 原创

2万+: 周排名

6589: 总排名

39万+: 访问

: 等级

5163: 积分

243: 粉丝

330: 获赞

39: 评论

716: 收藏

私信

关注

分类专栏

最新评论

NCCL的Double Binary Tree实现原理
yangyangv5: 博主请教一些问题，ring allreduce在设备数量足够大的时候可以近似看所 2S/B+SC,这部分性能与设备无关了，和tree相比tree在性能上的优势是什么呢？RingAllReduce，每次每个节点等量的发送和接收，所以接收到的加和完后，没有带宽再同时发送了这段话不是很理解
Tensorflow论文解读
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Mesos+Docker+Tensorflow集群解决方案
CSDN-Ada助手: 有人说无监督学习才是AI的未来，否则会有多少人工就有多少智能，元芳你怎么看呢？
B树和Clustered/Non-Clustered index
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
DeepSpeed MoE
柒免: 您好，请问您有成功运行实际的代码吗？多机多卡推理moe模型这种？想请教一下

最新文章

2024

11月 4篇

10月 1篇

09月 5篇

08月 9篇

07月 9篇

06月 22篇

05月 16篇

04月 3篇

2023年2篇

2022年23篇

2021年22篇

2020年63篇

2019年132篇

2018年6篇

2017年34篇

2016年22篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值