FastText情感分析和词向量训练实战——Keras算法练习

本文介绍了Facebook的FastText模型,用于文本分类和词向量训练。通过Keras实现情感分析任务,利用n-gram特征增强,展示了模型的简洁高效,并探讨了模型在解决实际问题中的应用价值。
摘要由CSDN通过智能技术生成

 fasttext是facebook开源的一个词向量与文本分类工具 ,其最大的优点就是快,同时不失精度。 此算法有两个主要应用场景:

  • 文本分类
  • 词向量训练

工业界碰到一些简单分类问题时,经常采用这种简单,快速的模型解决问题。

FastText原理简介

FastText原理部分有3个突出的特点:

  • 模型简单,其结构有点类似word2vector中的CBOW架构,如下图所示。FastText将句子特征通过一层全连接层映射到向量空间后,直接将词向量平均处理一下,就去做预测。

    模型架构

  • 使用了n-gram的特征,使得句子的表达更充分。笔者会在实战中详细介绍这部分的操作。
  • 使用 Huffman算法建立用于表征类别的树形结构。这部分可以加速运算,同时减缓一些样本不均衡的问题。

其中比较有意思的是,做完分类任务后,模型全连接层的权重可以用来做词向量。而且由于使用了n-gram的特征,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文宇肃然

精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值