[CS224n] week1-Word Vector词向量

Joyeishappy

于 2018-11-05 10:25:40 发布

阅读量245

点赞数

分类专栏： cs224n 文章标签： cs224n nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Joyeishappy/article/details/83743950

版权

cs224n 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1. Word meaning

计算机如何表达词的意思

词呢，通常被认为是表达意思的最小单位了。但是语言学专业好像不是这样，而是以词素为单位。（之前google了一下没怎么懂...有人懂可以给我留言一下喔，谢谢～）

分类词典。WordNet词库，比如NLTK中可以通过WordNet查询熊猫的hypernyms (is-a，上位词)，得到“食肉动物”“动物”之类的上位词。也可以查询“good”的同义词——“just品格好”“ripe熟了”。

discrete representation离散表示

离散表示，将词表示出来，典型的“one-hot”独热编码（localist representation局部表示）。这种就是把词库中的n个所有词当成一个n维的向量。这样呢第一个词语的表示方法就是把n维向量的第一位置1。第二个词语就是第二位置1。以此类推。

这种表示确实可以把词表示出来，但是有两个最主要的问题：

维度灾难：课程中slides里的图，到最后文本词库不断的增加，维度太大。

词间关系：词与词之间意思是相近的，不是单独而存在的。“good”和“great”意思相近，但是o-h独热编码没有这一层的表示。那就后来有了distributed representation.

distributed representations

至此，我们需要一种用向量直接编码词含义的方法。

现代统计自然预言处理最成功的思想，也是后续有了word2vec工作的思想基础吧。

我们可以通过一个词的邻居词的意思来知道这个中心词的意思。

总之呢，最后表示出来的词向量长这个样子。中心词是“linguistics”。这个维数呢根据情况自己定义。

学习神经网络word embeddings的基本思路

首先呢，定义一个模型（不想写了，先把作业的记录写了。这个理论有空再写吧）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[CS224n] week1-Word Vector词向量

1. Word meaning 计算机如何表达词的意思词呢，通常被认为是表达意思的最小单位了。但是语言学专业好像不是这样，而是以词素为单位。（之前google了一下没怎么懂...有人懂可以给我留言一下喔，谢谢～）分类词典。WordNet词库，比如NLTK中可以通过WordNet查询熊猫的hypernyms (is-a，上位词)，得到“食肉动物”“动物”之类的上位词。也可以查...
复制链接

扫一扫

专栏目录

Joyeishappy CSDN认证博客专家 CSDN认证企业博客

码龄6年

43: 原创

8万+: 周排名

138万+: 总排名

15万+: 访问

: 等级

1745: 积分

19: 粉丝

50: 获赞

24: 评论

194: 收藏

私信

关注

热门文章

分类专栏

个人经验 2篇
ES 1篇
问题 2篇
论文写作 1篇
复习基础再基础 5篇
安装 6篇
ubuntu 5篇
cs231n 1篇
linux小工具 1篇
cs224n 6篇
python编程 8篇
numpy
math 1篇
paper 1篇
nlp 6篇
库 3篇
云计算 1篇
C#编程 6篇

最新评论

ES中装jieba分词插件
Mr_JGuo: 这个报错是你需要拉 github 的子项目。执行下 git submodule update --init --recursive [/code]
mysqladmin: connect to server at 'localhost' failed error: 'Access denied for user 'root'@'localhost
misplaced favour: 没有权限怎么办，MySQL报权限错误
ES中装jieba分词插件
邪恶小法师—维迦: 如果是的话，是这么解决的啊！是要降低版本吗
ES中装jieba分词插件
邪恶小法师—维迦: 大佬，你执行 ./gradlew clean pz 也是报了 FAILURE: Build failed with an exception. * What went wrong: Could not determine the dependencies of task ':compileJava'. > Could not resolve all task dependencies for configuration ':compileClasspath'. > Could not resolve project :jieba-analysis. Required by: project : > No matching configuration of project :jieba-analysis was found. The consumer was configured to find an API of a library compatible with Java 8, preferably in the form of class files, preferably optimized for standard JVMs, and its dependencies declared externally but: - None of the consumable configurations have attributes. * Try: > Run with --stacktrace option to get the stack trace. > Run with --info or --debug option to get more log output. > Run with --scan to get full insights. * Get more help at https://help.gradle.org Deprecated Gradle features were used in this build, making it incompatible with Gradle 8.0.
C# 串口读取中文数据
bilsnfowp: 感谢！！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。