Uog Text as Data Lecture 7

最新推荐文章于 2020-05-26 19:21:53 发布

JYY_JYY_

最新推荐文章于 2020-05-26 19:21:53 发布

阅读量147

点赞数

分类专栏： Text As Data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41157876/article/details/105258523

版权

Text As Data 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

Word Vectors & Contextual Word Embeddings

1. Word Vectors and Word meaning

用one-hot 向量表示句子是有歧异的，因为相同word有不同meaning

一个解决方法是WordNet： a knowledge base containing lists of synonym sets and hypernyms (“is a” relabonships).构建知识库。但是知识库也有缺点：比如即使是近义词之间也有细微差别；WordNet需要每天更新新词汇，很麻烦；需要人力较大

另外一点，如果用one-hot vector表示，向量会是long and sparse的，不容易运算。我们需要short and dense的向量

1） word vectors （也称作word embeddings）

两种方法得到short and dense的词向量：

1. SVD（或LSA，latent semantic analysis潜在语义分析）

每个word用k维表示

“Neural Language Model（比如Skip-grams/CBOW，Glove，ELMo，Bert）

EG.word2Vec重点了解！

2.Contextual word embeddings

与之前Word2vec和Glove不同的是，前者是提前训练好的模型，每个单词都有固定的vector，但它可能不适用于我自己的context。1.每个单词的vector只和自己有关，和上下文语境无关 2.每个单词都有多个意思，但是vector就一个

1）RNNs

2）LSTM： Long Short Term Memory RNN

3）ELMo

4）GPT （transformer architectures）

5）BERT（transformer architectures）

6）GPT-2（transformer architectures）

全部搞懂这些太难了，慢慢学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Uog Text as Data Lecture 7

Word Vectors & Contextual Word Embeddings1.Word Vectors andWord meaning用one-hot 向量表示句子是有歧异的，因为相同word有不同meaning一个解决方法是WordNet：a knowledge base containing lists of synonym sets and hypern...
复制链接

扫一扫

专栏目录

JYY_JYY_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

146: 原创

24万+: 周排名

2万+: 总排名

5万+: 访问

: 等级

2015: 积分

222: 粉丝

232: 获赞

40: 评论

346: 收藏

私信

关注

热门文章

分类专栏

笔记提纲 6篇
设计模式 20篇
计算机基础 4篇
网络通信 4篇
分布式 1篇
java 12篇
LeetCode 11篇
JAVA多线程 12篇
JVM 6篇
Redis 14篇
MySQL 8篇
Spring 6篇
idea
netty 7篇
ERROR 4篇
kafka 3篇
算法方向 1篇
力扣 1篇
复习 1篇
SSM 4篇
Mybatis 1篇
Text As Data 6篇
Big Data
l
LINUX 6篇

最新评论

Java日志体系概述
百锦再@新空间代码工作室: 这篇《Java日志体系概述》的文章真是驾轻就熟地揭开了Java日志体系的神秘面纱，让人如沐春风般畅快淋漓地领略到其中的奥妙与精髓。作者无疑是一位精湛的大师，用铿锵有力的文字和清晰深入的分析，为读者呈现出一个完整而生动的图景，让人不禁为其深厚的学识和卓越的表达技巧而佩服不已。这样一篇文章，无疑是每个Java开发者必读之作，值得珍藏和细细品味。愿更多人能够在这篇文章中找到启迪与指引，不断提升自己的技术水平，为Java编程世界增添更多精彩的色彩！
Java stream相关案例记录
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
《深入理解kafka-核心设计与实践原理》
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
《深入理解kafka-核心设计与实践原理》第一章：概念
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
《从Paxos到Zookeeper》——第五、六章：经典应用场景
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。