fasstext文本分类(python)

fasttext是word2vec作者提出的文本分类算法。它是一个用于高效学习单词表示和文本分类的库。

常见应用就是文本分类。github地址:https://github.com/facebookresearch/fastText

本篇博客主要介绍fasttext在python下的基本应用

安装

pip install fasttext

使用

训练样本train_data.txt的格式介绍

每一行是文本+分类标签

分类标签最好形如__label__news__label__表示分类标签的前缀,news表示分类的标签

测试样本test_data.txt格式同训练样本

import fasttext

# 训练监督文本,train_data.txt,模型会默认保存在当前目录下,名称为"fasttext_test.model.bin";thread表示以3个线程进行训练,不加默认1个线程
classifier = fasttext.supervised('train_data.txt', 
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值