import jieba.posseg as pseg
words = pseg.cut("你想去学校填写学生寒暑假住校申请表吗?")
print(words)
#输出结果:<generator object cut at 0x0000000037FFBF10>
#以下代码拷到IDE中不能直接执行,需要引掉其中一行运行另一行才能出现所示输出结果
for word, flag in words:
print('%s %s' % (word, flag))
#输出结果:
'''你 r
想 v
去 v
学校 n
填写 v
学生 n
寒暑假 n
住校 n
申请表 n
吗 y'''
print([w for w in words])
#输出结果:[pair('你', 'r'), pair('想', 'v'), pair('去', 'v'), pair('学校', 'n'), pair('填写', 'v'), pair('学生', 'n'), pair('寒暑假', 'n'), pair('住校', 'n'), pair('申请表', 'n'), pair('吗', 'y'), pair('?', 'x')]
jieba具有对分词的词性进行标注的功能,词性类别如下:
参考
jieba分词中的词性类型
中文分词工具jieba中的词性类型
噢噢噢噢噢噢噢噢哦哦哦哦哦哦哦哦哦哦哦哦#添加这行字是检验文章是否可以修改