Python自然语言处理—提取词干

最新推荐文章于 2023-10-24 17:29:40 发布

午匀需

最新推荐文章于 2023-10-24 17:29:40 发布

阅读量3.9k

点赞数

分类专栏： Python-自然语言处理文章标签： python 自然语言处理提取词干

本文链接：https://blog.csdn.net/m0_38126215/article/details/84023206

版权

一提取词干

在英文中同一个词的形式是有多种的，名词的单数复数、动词的现在和过去式等等，所以在处理英文时要考虑词干的抽取问题。这里直接调用Nltk自带的两个词干抽取器

import re
import nltk

raw = """DENNIS: Listen, strange women lying in ponds distributing swords 
is no basis for a system of government. Supreme executive power derives from 
a mandate from the masses, not from some farcical aquatic ceremony."""

tokens = nltk.word_tokenize(raw)  # 分词 如果该方法调用错误请运行 nltk.download('punkt') 

porter = nltk.PorterStemmer()
print([porter.stem(t) for t in tokens])
lancaster = nltk.LancasterStemmer()
print([lancaster.stem(t) for t in tokens])

结果如下

porter：['denni', ':', 'listen', ',', 'strang', 'women', 'lie', 'in', 'pond', 'distribut', 'sword', 'is', 'no', 'basi', 'for', 'a', 'system', &

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

午匀需

关注关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
Python自然语言处理—提取词干

一提取词干在英文中同一个词的形式是有多种的，名词的单数复数、动词的现在和过去式等等，所以在处理英文时要考虑词干的抽取问题。这里直接调用Nltk自带的两个词干抽取器import reimport nltkraw = """DENNIS: Listen, strange women lying in ponds distributing swords is no basis for...
复制链接

扫一扫