Task04:条件随机场
条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型。
https://www.cnblogs.com/shixiangwan/p/8983274.html
以下内容多来自上图及链接。
一、马尔科夫随机场
条件随机场是马尔可夫随机场的特例,这种模型中有x和y两组随机向量。前者是观测序列,其值可见;后者是隐变量,也称为标签序列,其值不可见。如果给定x的条件下y是马尔可夫随机场,则称为条件随机场。
(1)邻近
1)概率无向图模型:
变量的Y1邻近点是Y2/Y3/Y4/Y5,变量Y4的邻近点是Y1/Y7/Y6,变量Y7的邻近点是Y5/Y4。邻近点的含义是用无向边相连,存在相关的两个随机变量。
(2)马尔科夫随机场
2)马尔科夫随机场的本质是 概率无向图 ,之所以叫马尔科夫随机场的原因是随机变量间 满足成对马尔科夫性、局部马尔科夫性和全局马尔科夫性 ,这三种性质在理论上被证明是等价的,所以我们就介绍成对马尔科夫性一种,马尔科夫性是关于条件独立的一种方法。
成对马尔科夫性是指图G中任意两个没有边连接的结点所对应的的两个随机变量是条件独立的。
给定一个联合概率分布P(Y),若该分布满足成对、局部或全局马尔科夫性,就称此联合概率分布为概率无向图模型或马尔科夫随机场。
局部马尔科夫性(黑色与白色点永远不相邻,即成对马尔科夫性)
二、条件随机场
条件随机场(CRF)是给定随机变量X的条件下,随机变量Y的马尔科夫随机场。在实际中,运用最多的是标注任务中的线性链条件随机场(linear chain conditional random field)。这时,在条件概率模型P(Y|X)中,Y是输出变量,表示标记序列,X是输入变量,表示需要标注的观测序列(状态序列)。
假设有无向图模型,其顶点对应的随机向量为y,对于图中任意顶点u,与该顶点有边连接的顶点集合为W,除u之外的顶点的集合为O。如果满足
则称条件概率p(y丨x)为条件随机场。
(1)线性链条件随机场
怎么讲呢 ,这个条件随机场我感觉比线性回归和昨天的EM都要难理解。资料也比较难收集。有些乱,需要补充的其他知识很多。
三、参考学习资料
https://blog.csdn.net/Scythe666/article/details/82021692
这篇文章也是不错的。