nltk 单词还原为词干

最新推荐文章于 2024-02-02 16:27:53 发布

Cocktail_py

最新推荐文章于 2024-02-02 16:27:53 发布

阅读量489

点赞数

分类专栏： nlp

本文链接：https://blog.csdn.net/Cocktail_py/article/details/119946853

版权

nltk SnowballStemmer 词干提取英语自然语言处理

关键词由CSDN通过智能技术生成

nlp 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

import nltk
from nltk.stem.snowball import SnowballStemmer

# the stemmer requires a language parameter
snow_stemmer = SnowballStemmer(language='english')

# list of tokenized words
words = ['cared', 'university', 'fairly', 'easily', 'singing',
         'sings', 'sung', 'singer', 'sportingly']

# stem's of each word
stem_words = []
for w in words:
    x = snow_stemmer.stem(w)
    stem_words.append(x)

# print stemming results
for e1, e2 in zip(words, stem_words):
    print(e1 + ' ----> ' + e2)

cared ----> care
university ----> univers
fairly ----> fair
easily ----> easili
singing ----> sing
sings ----> sing
sung ----> sung
singer ----> singer
sportingly ----> sport

参考：https://www.geeksforgeeks.org/snowball-stemmer-nlp/