BiLSTM+CRF 通吃序列标注任务,这些任务包括:词性标注POS(Part of speech),名词词组分块(NP-CHUNKING)和命名实体识别。
命名实体识别的一个商业应用:识别用户搜索句子中的商品(实体,使用用户查询句子训练),然后提供该商品的广告。这个点子牛逼哦,问答机器人那可以试着做一个应用连接百度搜索。
此篇论文之前的序列标注任务,多使用线性统计模型,如隐马尔科夫HMM,最大熵马尔科夫模型MEMMs,条件随机场,最好的就是Conv+CRF,卷积层上接条件随机场。
条件随机场可以提取句子级别的特征。他会对紧挨着的两个tag进行计算,限制不合理的标签序列。最后对一个单词的分类结果由两部分组成,s=[A+f],A是crf的概率,f是神经网络给出的概率,这就很明白了,如果神经网络给出的B-PER紧挨着B-PER,那么cf给出的概率值会很低,导致B-PER转变成别的类别(很可能是I-PER)