fasttext是个好东西,是由facebook在2016年推出的一个训练词向量的模型。相比于之前Google的word2vec,fasttext可以解决out of vocabulary的问题。fasttext还能够用于有监督的文本分类。更赞的是,facebook提供了200多种语言的预训练模型和词向量。
然而,在安装完fasttext后,当我读取了3GB的中文模型时,却出了下面的问题:
Traceback (most recent call last):
File "text_fasttext.py", line 7, in <module>
text()
File "text_fasttext.py", line 4, in text
model = fasttext.load_model('wiki.zh.bin')
File "fasttext/fasttext