NLP论文学习笔记-fasttext

Fasttext是Armand Joulin在EACL 2017提出的文本分类模型,它结合了深度学习和机器学习的优点,实现了快速训练和测试。在保持与深度学习分类器相当精度的同时,Fasttext在CPU上的训练和预测速度显著提高。尽管模型结构简单,但通过层次softmax和n-gram特征,Fasttext在多个任务上取得了良好的效果。
摘要由CSDN通过智能技术生成

论文题目: Bag of Tricks for Efficient Text Classification
作者:Armand Joulin (Facebook)
发表时间:EACL 2017

论文思想:融合基于深度学习和机器学习的文本分类模型,特点速度快,可以在CPU上运行。

Abstract

  1. 本文为文本分类任务提出了一种简单并且高效的基准模型——Fasttext。
  2. Fasttext模型在精度上和基于深度学习的分类器平分秋色,但是在训练和测试速度上Fasttext快几个数量级。
  3. 我们使用标准的多核CPU在10亿词的数据集上训练Fasttext,用时少于10分钟,并且在一分钟内分类好具有312K类别的50万个句子。

网络结构

该网络结构类似CBOW模型,输入的是词向量,经过隐藏层,获取句子向量,然后线性变换,获取分类。
在这里插入图片描述

# embedding层,获取词向量特征
# AvgPool1d 平均池化,获取句子特征
# 线性变换
class Fasttext
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值