word embedding系列（三） FastText

最新推荐文章于 2022-06-22 13:50:20 发布

ty44111144ty

最新推荐文章于 2022-06-22 13:50:20 发布

阅读量830

点赞数

分类专栏：算法 nlp 机器学习文章标签： fasttext nlp 词向量机器学习文本分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ty44111144ty/article/details/99017953

版权

本文是word embedding系列的第三篇，重点介绍Facebook的FastText。内容涵盖FastText的词向量、文本分类和代码示例。FastText利用n-gram和层次Softmax改进了词向量学习，并能进行文本分类。文章提供了代码实践和精度评估。

摘要由CSDN通过智能技术生成

本系列分为四部分，这篇文章是本系列第三篇，在公众号上有写过：word embedding系列（三） FastText，现在搬到CSDN上~

欢迎关注我的公众号，微信搜 algorithm_Tian 或者扫下面的二维码~

现在保持每周更新的频率，内容都是机器学习相关内容和读一些论文的笔记，欢迎一起讨论学习~

fastText 是 facebook 开源的一个词向量计算以及文本分类工具，fastText 方法包含三部分：模型架构、层次 Softmax 和 N-gram 特征。

该工具的理论基础是以下两篇论文：

Enriching Word Vectors with Subword Information 词向量（n-gram subword+skip-gram）

Bag of Tricks for Efficient TextClassification 分类（cbow+h softmax）

本篇文章分为三部分来介绍fasttext：

1. FastText中的词向量

2.fasttext预测标签

词向量模型

文本分类+精度评估

查看分类标签

由于fasttext基本就是基于word2vec，所以本文就不介绍详细公式，只讲与word2vec不同的地方。如果想看公式推导，可以参考上一篇文章

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。