fasttext原理与实战

本文介绍了fasttext的基本原理,包括模型框架、文档向量化(类似CBOW)、多分类策略(分层softmax)以及CBOW的向量化技术。fasttext实战部分涉及数据格式和简单的训练代码。
摘要由CSDN通过智能技术生成

参考文档:

https://zhuanlan.zhihu.com/p/32965521

 

一、模型框架

二、核心思想

      将输入文档的词及n-gram的向量叠加平均得到文档向量;然后采用文档向量做softmax的多分类。

1、文档向量化

      类似CBOW

      文档切词得到词汇集合

      词汇向量化

      词汇向量求平均得到文档向量

2、多分类

      分层softmax模型

     文档向量输入多分类器进行分类预测

三、向量化技术—CBOW

参考:https://blog.csdn.net/u010665216/article/details/78724856

1、模型框架

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值