自然语言处理之词性标注（POS）

最新推荐文章于 2024-05-16 16:45:51 发布

m0_46483236

最新推荐文章于 2024-05-16 16:45:51 发布

阅读量3.3k

点赞数 2

分类专栏： nlp 文章标签： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46483236/article/details/116205333

版权

nlp 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、概念：

词性标注（Part-of-Speech tagging 或POS tagging)，又称词类标注或者简称标注，是指为分词结果中的每个单词标注一个正确的词性的程序，也即确定每个词是名词、动词、形容词或其他词性的过程。词主要可以分为以下2类：

实词：名词、动词、形容词、状态词、区别词、数词、量词、代词
虚词：副词、介词、连词、助词、拟声词、叹词。

二、常用的词性标注集如下：

《PFR人民日报标注语料库》词性编码表——40多个标记
《现代汉语语料库加工规范——词语切分与词性标注》词性标记——40多个标记
计算所ICTCLAS3.0汉语词性标记集——共计99个标记，包括22个一类、66个2类、11个三类
HanLP词性标记集——兼容上述2和3
BosonNLP词性标注——共22个大类，70个标签
结巴分词中出现的类型
StanfordNLP的词性标注（中文）
StanfordNLP的词性标注（英文）

详见：https://www.biaodianfu.com/pos-tagging-set.html

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理之词性标注（POS）

一、概念：词性标注（Part-of-Speech tagging 或POS tagging)，又称词类标注或者简称标注，是指为分词结果中的每个单词标注一个正确的词性的程序，也即确定每个词是名词、动词、形容词或其他词性的过程。词主要可以分为以下2类：实词：名词、动词、形容词、状态词、区别词、数词、量词、代词虚词：副词、介词、连词、助词、拟声词、叹词。二、常用的词性标注集如下：《PFR人民日报标注语料库》词性编码表——40多个标记《现代汉语语料库加工规范——词语切分与词性标注》词性标记——
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。