流水账︱Elmo词向量中文训练过程杂记

最新推荐文章于 2024-07-19 14:08:52 发布

悟乙己

最新推荐文章于 2024-07-19 14:08:52 发布

阅读量2.4w

点赞数 12

分类专栏： NLP︱R+python Tensorflow+Keras 付费-智能写作专栏文章标签： elmo 词向量训练 bilstm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_26917383/article/details/81913790

版权

付费-智能写作专栏同时被 3 个专栏收录

33 篇文章 709 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

63 篇文章 33 订阅

订阅专栏

Tensorflow+Keras

20 篇文章 53 订阅

订阅专栏

本文介绍了ELMo词向量模型，强调其上下文依赖的特点，并分享了中文训练项目、流程及预训练模型的使用。作者提到了训练过程中的经验和技巧，包括对不同任务的敏感层选择，以及解决效率问题的策略。

摘要由CSDN通过智能技术生成

文章目录

@[toc]

1 elmo是什么？

ELMo的特点：

2 Elmo训练有哪些好项目？

有训练过程的项目

预训练模型：

3 Elmo训练流程

3.1 elmo训练流程

3.2 elmo如何fine-tune到其他领域？？

3.3 elmo具体使用的方式

4 英文预训练模型

4.1 首推[Elmo Embeddings in Keras with TensorFlow hub](https://towardsdatascience.com/elmo-embeddings-in-keras-with-tensorflow-hub-7eb6f0145440)

4.2 allenai/bilm-tf官方使用方式

4.3 UKPLab/elmo-bilstm-cnn-crf

4.4 Using ELMo programmatically

5 中文训练与相关经验

5.1 相关训练项目

5.2 elmo实战经验小结

5.2.1 一则

5.2.2 二则

5.2.3 三则

5.2.4 四则

1 elmo是什么？

参考：《文本嵌入的经典模型与最新进展》
人们已经提出了大量可能的词嵌入方法。最常用的模型是 word2vec 和 GloVe，它们都是基于分布假设的无监督学习方法（在相同上下文中的单词往往具有相似的含义）。

虽然有些人通过结合语义或句法知识的有监督来增强这些无监督的方法，但纯粹的无监督方法在 2017-2018 中发展非常有趣，最著名的是 FastText（word2vec的扩展）和 ELMo（最先进的上下文词向量）。

了解本专栏

超级会员免费看

关注

12
点赞
踩
51

收藏

觉得还不错? 一键收藏
13
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。