实习点滴(4)--CRF算法的特征模板总结

本文介绍了CRF算法中的特征模板,包括U-gram和B-gram。U-gram描述了单个位置的标签特征,B-gram则涉及前后位置的标签关系。举例说明了不同特征模板的使用情况,指出在词性标注等任务中,特征模板的选择对结果有显著影响。
摘要由CSDN通过智能技术生成

        最近工作中接触到了CRF算法以及CRF++,于是乎,去了解了关于这些的一系列的东西,打算总结总结CRF算法里的模板问题。

        我们知道,深度学习(Deeplearning)是不需要特征模板的,它会自己学习里边的规律,而CRF则是需要特征模板的,所以,选择什么样的特征模板是至关重要的。

      概念:

        CRF中一共存在两种模板:U-gramB-gram
        U-gram:也就是Unigram template,它描述了unigram feature。

        一元模板,表示只与当前位置对应的标签相关的特征

if (output = B and feature="U02:那") 
    return 1
else 
    return 0

        B-gram:也是Bigram template。

        二元模板,表示前一个位置和当前位置对应的标签相关的特征

        当类别数很大的时候,这种类型会产生许多可区分的特征,这将会导致训练和测试的效率都很低下。

      实例解释:

        实例如下:

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值