NLP基础二：python 词性标注

最新推荐文章于 2024-07-24 20:06:28 发布

柯努力

最新推荐文章于 2024-07-24 20:06:28 发布

阅读量598

点赞数

分类专栏： NLP python

本文链接：https://blog.csdn.net/kerry_55/article/details/100942997

版权

python 同时被 2 个专栏收录

25 篇文章 1 订阅

订阅专栏

NLP

5 篇文章 1 订阅

订阅专栏

一、jieba词性标注

"""
词性标注
"""
import jieba.posseg as pseg
result = pseg.cut("我是来自韩山师范学院，数学与统计学院的一名学生")
for w in result:
print(w.word,"/", w.flag, ",", end=' ')

打印输出：

我/r 是/v 来自/v 韩山/ns 师范学院/n ，/x 数学/n 与/p 统计/v 学院/n 的/uj 一名/m 学生/n

二、哈工大LTP词性标注

# 词性标注
from pyltp import Postagger
from pyltp import Segmentor
# 分词
segmentor = Segmentor()  # 初始化实例
segmentor.load('ltp_data/cws.model')  # 加载模型
postagger = Postagger() # 初始化实例
postagger.load('ltp_data/pos.model')  # 加载模型
words = segmentor.segment('我是来自潮州的韩山师范学院，数学与统计学院的一名学生')  # 分词
postags = postagger.postag(words)  # 词性标注
words_and_pos = zip(words, postags)
print(' '.join('%s/%s' % (word, tag) for (word, tag) in  zip(words, postags)))
postagger.release()  # 释放模型

输出结果：