NLP基础二:python 词性标注

5 篇文章 1 订阅

一、jieba词性标注

"""
词性标注
"""
import jieba.posseg as pseg
result = pseg.cut("我是来自韩山师范学院,数学与统计学院的一名学生")
for w in result:
print(w.word,"/", w.flag, ",", end=' ')

打印输出:

我/r 是/v 来自/v 韩山/ns 师范学院/n ,/x 数学/n 与/p 统计/v 学院/n 的/uj 一名/m 学生/n

二、哈工大LTP词性标注

# 词性标注
from pyltp import Postagger
from pyltp import Segmentor
# 分词
segmentor = Segmentor()  # 初始化实例
segmentor.load('ltp_data/cws.model')  # 加载模型
postagger = Postagger() # 初始化实例
postagger.load('ltp_data/pos.model')  # 加载模型
words = segmentor.segment('我是来自潮州的韩山师范学院,数学与统计学院的一名学生')  # 分词
postags = postagger.postag(words)  # 词性标注
words_and_pos = zip(words, postags)
print(' '.join('%s/%s' % (word, tag) for (word, tag) in  zip(words, postags)))
postagger.release()  # 释放模型

输出结果:

我/r 是/v 来自/v 潮州/ns 的/u 韩山/ns 师范学院/n ,/wp 数学/n 与/c 统计/v 学院/n 的/u 一/m 名/q 学生/n

(改天再更新)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柯努力

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值