《基于Tensorflow的知识图谱实战》 --- 有趣的词嵌入--word embedding（二）| fastText和预训练词向量

deng_den

已于 2022-06-25 11:13:59 修改

阅读量705

点赞数

分类专栏：深度学习_TensorFlow 文章标签： tensorflow 知识图谱深度学习

于 2022-06-22 13:50:20 首次发布

本文链接：https://blog.csdn.net/d_eng_/article/details/125392881

版权

⚽开发平台：jupyter lab

🎈运行环境：python3、TensorFlow2.x

第7章有趣的词嵌入--word embedding（二）| 更多的word embedding方法---fastText和预训练词向量

1. fastText的原理和基础算法
- 1.1 N-gram算法
- 1.2 Hierarchical Softmax算法
2. fastText训练以及与tensorflow2.x的协同使用（待完善）
- 2.1 fastText函数介绍
3. 使用其他预训练参数做Tensorflow词嵌入矩阵（中文）

word embedding(词嵌入)，常用来进行情感分析、同义词聚类、文章分类和打标签。
（1）该部分内容介绍：通过多种计算word embedding的方法循序渐进的了解如何获取对应的word embedding，之后通过实战使用word embedding进行文本分类。
（2）该章节将分为四个部分，分别为：

1.文本数据处理

2.更多的word embedding方法—fastText和预训练词向量

3.针对文本的卷积神经网络模型 — 字符卷积

4.针对文本的卷积神经网络模型 — 词卷积

5.使用卷积对文本分类的补充内容

1. fastText的原理和基础算法

优点：相对于传统的word2vec计算方法，fastText计算更快速和更新的一种word embedding方法
（1）fastText在保持高精度的情况下加快了训练速度和测试速度。
（2）fastText对word embedding的训练更加精准。
（3）fastText采用两个重要的算法：N-gram、Hierarchical Softmax。