NLTK词性标注和组快代码示例

import nltk
from nltk.tag.util import tuple2str
from nltk.corpus import treebank
from nltk.tag import untag
import os,os.path
import nltk.data

# nltk.download('universal_tagset')
# # 词性标注
text1 = nltk.word_tokenize("It is a pleasant day today")
print(nltk.pos_tag(text1))
# CC  - 并列连词
# CD  -基数
# DT  - 限定词
# EX  - 存在的there
# FW  - 外来词
# IN  - 介词或从属连词
# JJ  - 形容词
# JJR  - 形容词,比较级
# JJS  - 形容词,最高级
# LS  - 列表项标记
# MD  - 情态动词
# NN  - 名词,单数或不可数
# NNS  - 名词,复数
# NNP  - 专有名词,单数
# NNPS - 专有名词,复数
# PDT  -  前置限定词
# POS  - 所有格结尾
# PRP  - 人称代词
# PRP$  - 所有格代词(prolog版本为PRP-S)
# RB  - 副词
# RBR  - 副词,比较级
# RBS  - 副词,最高级
# RP  - 小品词
# SYM  - 符号
# TO - to
# UH  - 叹词
# VB  - 动词
# 基本形式VBD  - 动词,过去式
# VBG  - 动词,动名词或现在分词
# VBN  - 动词,过去分词
# VBP  - 动词,现在时非第三人称单数
# VBZ  - 动词,现在时第三人称单数
# WDT  -  WH-限定词
# WP  -  WH-代词
# WP $  - 所有格WH-代词࿰
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值