【deep learning学习笔记】Distributed Representations of Sentences and Documents

106 篇文章 2 订阅
49 篇文章 0 订阅

很久以前关注过一段时间word2vec,最近比较好奇doc2vec,找来资料看看。


时间:2014
作者:Mikolov (word2vec的作者)
发表于:icml
原文件:http://pan.baidu.com/s/1bnm7COB

主要内容:
继写出word2vec之后,接下来的问题是:能否在更大的语言单位上,如:短语、句子、段落、篇章,上面继续word2vec的工作,将这些语言单位用实属向量的方式表示出来。

思路:
作者思路很直接,即在word2vec模型的基础上,将神经网络的偏置b用一个向量来代替,参与训练,在获得每个词语的实属向量的同时,也获得这个代替偏置的向量。作者用这个向量来作为当前上下文content的表示向量。整个训练方式和word2vec基本一致。

实验:
作者一共写了两个实验,我看了第一个。是判断语句的情感倾向性的。关键在于作者如何使用他训练出来的phrasevec。使用方式如下:对目标语句进行分词,截取sub-phrase,每个sub-phrase对应一个作者训练出来的phrasevec。用这些phrasevec,结合LR模型,进行分类,从而预测目标语句的情感倾向。从结果上看,无论是二值分类(正面情感 vs 负面情感)还是多值分类,相比传统benchmark,作者的方法都有提升。

完。

转载请注明出处:http://blog.csdn.net/xceman1997/article/details/46290365



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值