自然语言处理--加载使用facebook的预训练 fastText 模型wiki-news-300d-1M.vec

fastText,与 Word2vec 中预测周围词不同,该算法预测周围的 n 个字符。例如,“whisper”将生成以下两字符的 gram 和 3 字符的 gram:

wh, whi, hi, his, is, isp, sp, spe, pe, per, er

fastText 为每个 n 字符的 gram 训练一个向量表示,其中包括词、拼错的词、词片段,甚至单个字符。这种方法比原来的 Word2vec 能够更好地处理罕见词。

# # .bin文件
# from gensim.models.fasttext import FastText
#
# ft_model = FastText.load_fasttext_format(model_file=MODEL_PATH)
# print(ft_model.most_similar('soccer'))

# .vec文件
from gensim.models import KeyedVectors

FASTTEXTFILE = "xxx\\wiki-news-300d-1M.vec"
ft_model = KeyedVectors.load_word2vec_format(FASTTEXTFILE)
print(ft_model.most_similar('soccer'))

备注:gensim 提供的 fastText API 的功能与 Word2vec 基本一致。在前面的方法也适用于 fastText 模型。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
fasttext-0.9.2-cp36-cp36m-win_amd64.whl是FastText库的一个特定版本,适用于Python 3.6并且在Windows操作系统上运行。 下载fasttext-0.9.2-cp36-cp36m-win_amd64.whl的目的是安装FastText库,以便在Python程序中使用FastText的功能。FastText是一个用于文本分类和文本表示的开源库,具有高效和强大的文本处理能力。 要进行fasttext-0.9.2-cp36-cp36m-win_amd64.whl的下载,可以按照以下步骤进行: 1. 打开浏览器,并进入FastText库的官方网站或可信赖的第三方Python库托管网站。 2. 在搜索框中输入"fasttext-0.9.2-cp36-cp36m-win_amd64.whl"进行搜索,或者在网站上浏览库的版本列表找到对应的版本。 3. 点击相关的下载链接,开始下载fasttext-0.9.2-cp36-cp36m-win_amd64.whl文件。下载过程可能需要一些时间,具体取决于您的网络速度和文件大小。 4. 下载完成后,可以将fasttext-0.9.2-cp36-cp36m-win_amd64.whl文件保存到本地的任意位置。 安装FastText库时,可以使用pip工具进行安装。在命令行中执行以下命令: ``` pip install fasttext-0.9.2-cp36-cp36m-win_amd64.whl ``` 安装过程可能需要一些时间,具体取决于您的计算机性能和网络速度。 通过完成以上步骤,您可以成功下载fasttext-0.9.2-cp36-cp36m-win_amd64.whl,并安装FastText库以在Python程序中使用FastText的功能。如果安装成功,您可以开始使用FastText进行文本分类和文本表示的任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值