python nltk库文本分词，去停用词，词语标准化（词干化，词性还原）

最新推荐文章于 2024-03-22 12:59:16 发布

Sibyl_Lqq

最新推荐文章于 2024-03-22 12:59:16 发布

阅读量2.7k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/Sibyl_Lqq/article/details/104989387

版权

import nltk 
from nltk.corpus import stopwords         #停用词
from nltk.tokenize import word_tokenize   #分词
from nltk.stem import PorterStemmer       #词干化
from nltk.stem import WordNetLemmatizer   #词形还原


stop_words = set(stopwords

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Sibyl_Lqq

关注关注

1
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
python nltk库文本分词，去停用词，词语标准化（词干化，词性还原）

import nltk from nltk.corpus import stopwords #停用词from nltk.tokenize import word_tokenize #分词from nltk.stem import PorterStemmer #词干化from nltk.stem import WordNetLemmatizer #词形还原...
复制链接

扫一扫