20200411

最新推荐文章于 2022-07-05 14:50:23 发布

Ike_Lin

最新推荐文章于 2022-07-05 14:50:23 发布

阅读量98

点赞数

分类专栏：备忘网络表示（图嵌入）人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ike_Lin/article/details/105460180

版权

备忘同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

网络表示（图嵌入）

8 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

词袋模型定义中位于相同窗口下的两个词之间的距离不会影响，这个忽视了一些信息，如果我们考虑这个问题，并且让机器自动学习给距离多远的词赋权重。

用词袋模型的方法，将所有的同一窗口下的词的词向量求和取（根据出现的频率加权）平均，然后将中心词的词向量作为标签。loss函数的计算可以考虑采用欧式距离。更好的方法是，

加一个tanh非线性映射，
每个维度加tanh非线性映射，之后相乘作为最后的loss。

理由：

左边合成的词向量相近 == 邻近语义环境相近，右边相近 == 中心词词义相近，中间的映射究竟究竟是什么含义？
更新模型参数的时候顺便更新了词向量，二者可能会有一个互相增益的作用（原层次softmax和负采样的方法似乎也有更新词向量的效果）

20200418

harp的代码实现中，先将一个图分成互不相连的子图，然后对每个子图进行粗粒化等操作。

直接将HARP获得的embedding作为ANRL中skipgram部分的初始化，稍微修改ANRL模型，使得ANRL能用HARP的优化成果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
20200411

词袋模型定义中位于相同窗口下的两个词之间的距离不会影响，这个忽视了一些信息，如果我们考虑这个问题，并且让机器自动学习给距离多远的词赋权重。用词袋模型的方法，将所有的同一窗口下的词的词向量求和取（根据出现的频率加权）平均，然后将中心词的词向量作为标签。loss函数的计算可以考虑采用欧式距离。更好的方法是，加一个tanh非线性映射，每个维度加tanh非线性映射，之后相乘作为最后的loss。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。