[565]python语言转换库snowballstemmer

安装

pip install snowballstemmer

这是一款非常瘦小的语言转换库,支持15种语言。

    'danish': 丹麦语,
    'dutch': 荷兰语,
    'english': 英语,
    'finnish': 芬兰语,
    'french':  法语,
    'german': 德语,
    'hungarian': 匈牙利语,
    'italian': 意大利语,
    'norwegian': 挪威语,
    'porter': 波特语,
    'portuguese': 葡萄牙语,
    'romanian': 罗马尼亚语,
    'russian': 俄语,
    'spanish': 西班牙语,
    'swedish': 瑞典语,
    'turkish': 土耳其语,

snowballstemmer模块有两个功能

snowballstemmer.algorithms函数报道查看一个可用的算法名称“字符串列表。

import snowballstemmer
>>> snowballstemmer.algorithms()
['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'porter', 'portuguese', 'romanian', 'russian', 'spanish', 'swedish', 'turkish']

该snowballstemmer.stemmer函数接受算法名称并报道查看Stemmer对象。

Stemmer有对象Stemmer.stemWord(word)方法状语从句:Stemmer.stemWords(word[])方法。

import snowballstemmer

stemmer = snowballstemmer.stemmer('english');
print(stemmer.stemWords("We are the world".split()));
['We', 'are', 'the', 'world']
from snowballstemmer import EnglishStemmer, SpanishStemmer
EnglishStemmer().stemWord("Gregory")
# Gregori
SpanishStemmer().stemWord("amarillo")
# amaril

参考:https://pypi.org/project/snowballstemmer/
https://github.com/shibukawa/snowball_py

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

周小董

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值