本笔记仅记录《统计学习方法》中各个章节算法|模型的简要概述,比较泛泛而谈,用于应对夏令营面试可能会问的一些问题,不记录证明过程和详细的算法流程。大佬可自行绕路。
更多章节内容请参阅:李航《统计学习方法》学习笔记-CSDN博客
目录
条件随机场CRF概述:
CRF是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型。比如用于命名实体识别,识别一个句子中的词性。
概率无向图模型:
又称为马尔可夫随机场,是一个可以由无向图表示的联合概率分布。
具体细节不再赘述。
条件随机场的定义与形式:
定义:
形式:
条件随机场的形式包括参数化形式、简化形式、矩阵形式。
条件随机场的概率计算问题:
像隐马尔可夫模型那样,引入前向-后向向量。
条件随机场的学习算法:
CRF的学习方法包括极大似然估计以及正则化的极大似然估计,具体的优化实现算法有改进的迭代尺度法IIS、梯度下降法以及拟牛顿法。
条件随机场的预测算法:
CRF的预测算法采用著名的维特比算法。
条件随机场的名字由来:
条件随机场(CRFs)之所以被称为“条件随机场”,是因为它们通过条件概率分布 𝑃(𝑌∣𝑋) 直接建模观测序列 𝑋和标注序列 𝑌之间的关系,并且使用无向图表示随机变量(标注)之间的依赖关系。这种方法可以更好地捕捉观测序列中的上下文信息,并灵活地包含多种特征,从而在序列标注等任务中提供更准确的结果。