自然语言处理笔记 第六章 词性标注

自然语言处理笔记

自然语言处理(NLP)笔记 第一章 词典分词-CSDN博客

自然语言处理笔记 第二章 二元语法与中文分词-CSDN博客

自然语言处理笔记 第三章 隐马尔科夫模型与序列标注-CSDN博客

自然语言处理 第四章 感知机分类与序列标注-CSDN博客

自然语言处理笔记 第五章 条件随机场与序列标注-CSDN博客

自然语言处理笔记 第六章 词性标注-CSDN博客

自然语言处理笔记 第七章 命名实体识别-CSDN博客

机器翻译综述-CSDN博客

领域词性标注-CSDN博客


词性:动词,名词等       所有词性的集合称为词性标注集

用途: 遇到OOV时,通过OOV的词性猜测其用法

       直接用于抽取一些信息,名词的形容词是该名词的评价和性质信息

两个难点:同一个词不同语境可能有不同的词性;OOV的词性判别

词性标注可以作为分词的后续任务,也可以与分词合并成一个任务

  多个任务的模型称为联合模型

  复合式标签:综合考虑样本多个方面的性质

  

联合标注集VS独立模型:M*N, M+N

NLP流水线:给一个原始输入x逐步赋予分词,词性等各种性质

    中文分词语料库远远多于词性标注语料库

实际工程上通常在大型分词语料库上训练分词器

然后与小型词性标注语料库上的词性标注模型组合为一个流水线式词法分析器

准确率:

自定义词性:将特定的一些词语打上自定义的标签

  1、朴素实现:基于词典的规则系统,用户将自己关系的词语以及自定义词性以词典的形式挂载

词典只是机械式匹配。无法解决一词多词性问题

  2、标注语料:标注一份语料库,然后训练一个统计模型

     通过统计模型,根据上下文语境判断一个词的词性

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值