fasttext学习使用入门

fasttext源码位置

功能一:单词表示学习

1:为了学习词向量(向量表示),我们可以使用fasttext.train_unsupervised函数,像下面这样:

import fasttext
#  data.txt :准备语料时,只需要去掉原始数据中的label标签即可。
# Skipgram model :
俩种方式
model = fasttext.skipgram('data.txt','model')
model = fasttext.train_unsupervised('data.txt', model='skipgram')
# or, cbow model :
model = fasttext.cbow('data.txt','model')
model = fasttext.train_unsupervised('data.txt', model='cbow')

2:保存和加载模型对象:

  model.save_model("model.bin")
  model = fasttext.load_model('model.bin')

3:模型运用

# 加载前面训练好的模型 model.bin
model = fasttext.load_model("model.bin")
print (model.words) # model 中的词汇列表
print (model["king"]) # "king" 的词向量

功能二:文本分类

分类过程:
fasttext在进行文本分类时,huffmax树叶子节点处是每一个类别标签的词向量。在训练过程中,训练语料的每一个词也会得到响应的词向量。输入为一个window 内的词对应的词向量,隐藏层为这几个词的线性相加。相加的结果作为该文档的向量。再通过softmax层得到预测标签。结合文档真实标签计算 loss,梯度与迭代更新词向量(优化词向量的表达)。

from fastText import train_supervised, load_model

流程:
1:数据准备 fasttex_train.txt
处理后的数据: 每行代表一个文本,以\n结尾,文本以空格分隔单词,如下所示,文本今天天气真的太好了处理后为:
今天 天气 真的 太好 了 __label__1

2.训练模型

import fasttext
#第一个参数是前面得到的 fasttex_train.txt 
model = train_supervised(input=fasttex_train.txt ,
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值