Bidirectional LSTM-CRF Models for Sequence Tagging 阅读有感

BiLSTM+CRF 通吃序列标注任务,这些任务包括:词性标注POS(Part of speech),名词词组分块(NP-CHUNKING)和命名实体识别。

命名实体识别的一个商业应用:识别用户搜索句子中的商品(实体,使用用户查询句子训练),然后提供该商品的广告。这个点子牛逼哦,问答机器人那可以试着做一个应用连接百度搜索。

此篇论文之前的序列标注任务,多使用线性统计模型,如隐马尔科夫HMM,最大熵马尔科夫模型MEMMs,条件随机场,最好的就是Conv+CRF,卷积层上接条件随机场。

条件随机场可以提取句子级别的特征。他会对紧挨着的两个tag进行计算,限制不合理的标签序列。最后对一个单词的分类结果由两部分组成,s=[A+f],A是crf的概率,f是神经网络给出的概率,这就很明白了,如果神经网络给出的B-PER紧挨着B-PER,那么cf给出的概率值会很低,导致B-PER转变成别的类别(很可能是I-PER)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值