什么是条件随机场CRF?

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Prateek Joshi

编译:ronghuaiyang

导读

这是前一篇博客的续篇,给大家说明一些条件随机场的基本概念,非常浅显,给大家入个门


640?wx_fmt=jpeg

这是前一篇博客的续篇。在那篇文章中,我们首先讨论了为什么需要条件随机场。我们在机器学习中有图模型,广泛用于解决许多不同的问题。但是条件随机场(CRFs)解决了这些图模型所面临的一个关键问题。图模型的一个流行例子是隐马尔可夫模型(HMMs)。HMMs由于其鲁棒性和准确性,近年来得到了广泛的应用。它们被用于计算机视觉、语音识别等时间序列相关的数据分析。CRFs在许多不同的任务中都优于HMMs。这是怎么回事?这些CRFs是什么?它们是如何表示的?

CRF是如何解决图模型所面临的的问题的?

解决这个问题的一个方法是直接对条件分布建模,这就是分类所需要的全部内容。CRFs本质上是一种结合分类和图模型优点的方法,将对多元数据进行紧凑建模的能力与利用大量输入特征进行预测的能力相结合。条件模型的优势在于,只涉及输入数据变量的依赖关系在条件模型中不起作用,因此准确的条件模型的结构可以比联合模型简单得多。对于机器学习极客来说,生成模型和CRFs之间的区别类似于朴素贝叶斯分类器和逻辑回归分类器之间的区别。事实上,多项式逻辑回归模型可以看作是最简单的CRF,其中只有一个输出变量。

CRFs是什么?

条件随机场是对结构化数据(如序列、树和网格)进行标记和分段的概率框架。这在建模时间序列数据时特别有用,其中时间依赖性可以以各种不同的形式表现出来。其基本思想是在给定一个特定的观察序列的情况下,定义标签序列上的条件概率分布,而不是标签和观察序列上的联合分布。CRFs的主要优点是对独立性假设的放宽。独立假设是指变量之间不相互依赖,也不以任何方式相互影响。情况并非总是如此,这可能导致严重的错误。

HMM vs CRF

640?wx_fmt=png

HMM是一个生成模型,它通过基于训练数据建模转换矩阵来直接给出输出。可以通过提供更多的数据点来改进结果,但是不能直接控制输出标签。HMM根据提供的训练数据来学习转换概率。因此,如果我们提供更多的数据点,那么我们就可以改进模型以包含更广泛的种类。CRF是一个判别模型,它输出一个置信度。在大多数情况下,这是非常有用的,因为我们想知道模型在那一点上对标签有多确定。这种置信度可以阈值化,以适应各种应用。置信度的好处是,与HMM相比,误警的数量较低。

相对于HMMs, CRFs的主要优势在于它们的条件概率的特性,这使得HMMs所需的独立性假设得到了放松。此外,CRFs避免了标签的偏差问题,这是基于有向图模型的马尔可夫模型所显示出来的弱点。CRF可以看作是HMM的一种泛化,或者我们可以说HMM是CRF的一种特殊情况,在这种情况下,使用常数概率来建模状态转换。CRFs在许多实际序列标记任务上都优于HMMs。

条件随机场的理论太深奥了,不能在两篇博文中讨论。这些文章只是向你介绍CRFs。当你在处理时序数据时,它们非常有用。有许多可用的库,如HCRF、CRFall、CRF++等,它们都具有很好的CRF功能定义和实现。你可以看看怎么使用。


640?wx_fmt=png— END—

英文原文:https://prateekvjoshi.com/2013/02/23/what-are-conditional-random-fields/


640?wx_fmt=jpeg

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧640?wx_fmt=gif


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值