langid的Python项目详细描述
py是一个独立的语言识别(langid)工具。
此包Python名称:langid
目前版本: langid 1.1.6
最后维护时间:Apr 5, 2016
摘要:langid.py is a standalone Language Identification (LangID) tool.
安装命令:pip install langid
其它:langid 这个Python第三方库的作者没有提供更多的项目描述信息了。
在做小德莫的时候有识别需求发现了它故分享出来给大家,有了这个模块可以减少我们自己去识别语句中的成分组成,肥肠的好用。
注:语言类型主要参考的是ISO 639-1语言编码标准,详见ISO 639-1百度百科
下面是演示代码
import langid
def try_lang():
t1 = "ルカ:ならよかった。ミチルってあの年ですごい苦労してんだよ。 "
t2 = "한국어"
t3 = "宿題を終えて、私はベッドの上で横になって目を閉じて神を養って、突然、背後が涼しくなって、一陣の風が吹いて、私は目を開けて見て、空がすでに明るくなったことを発見して、私は一面の茂った森の中で横になっています"
t4 = "After finishing my homework, I lay down on my bed, closed my eyes, raised God, suddenly got cool behind me, and the wind was blowing, I found my eyes open and looked empty, and I was lying in a thick forest"
t5 = "我躺在床上闭眼养神,突然,背后凉了,刮了一阵风,我睁开眼睛看,发现天空已经亮了,我躺在一片茂密的森林"
print(langid.classify(t1))
print(langid.classify(t2))
print(langid.classify(t3))
print(langid.classify(t4))
print(langid.classify(t5))
结果展示
个人感觉是挺好用的,可以省下很多自己写判断语种的时间。