词嵌入 Embedding: 从 Word2vec 到 Bert

最新推荐文章于 2023-06-02 20:41:31 发布

saluteman

最新推荐文章于 2023-06-02 20:41:31 发布

阅读量2.6k

点赞数

分类专栏： NLP 文章标签： NLP Bert 解读

本文链接：https://blog.csdn.net/chenfajun/article/details/103368658

版权

本文介绍了词嵌入的发展历程，从Word2vec的Hierarchical softmax和Negative sampling，到ELMo的Highway layer和Projection layer，再到BERT的Transformer、Pooler和Fine tune过程。BERT作为预训练模型，通过多层双向Transformer，改善了词向量的表示，且能在下游任务中通过Fine tune进行优化。

摘要由CSDN通过智能技术生成

Bert 的第一步是文字向量化。文字向量化从 Word2Vec 开始，逐渐走向成熟。

Word2vec

参考资料

官方网址：https://code.google.com/archive/p/word2vec/
论文

『Distributed Representations of Sentences and Documents』
      贡献：在前人基础上提出更精简的语言模型（language model）框架并用于生成词向量，这个框架就是 Word2vec
『Efficient estimation of word representations in vector space』
      贡献：专门讲训练 Word2vec 中的两个trick：hierarchical softmax 和 negative sampling
优点：Word2vec 开山之作，两篇论文均值得一读
 Xin Rong 的论文：『word2vec Parameter Learning Explained』：
！重点推荐！