FastText-PVDM，Distributed Representations of Sentences and

最新推荐文章于 2022-12-03 15:48:35 发布

薇酱

最新推荐文章于 2022-12-03 15:48:35 发布

阅读量228

点赞数

分类专栏： NLP 机器学习算法文章标签：算法机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17246605/article/details/117400421

版权

机器学习同时被 3 个专栏收录

12 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

git地址：https://github.com/aiweiw/fasttext-PVDM

train:

./fasttext PVDM -input train.txt -output model

infer

./fasttext predictPVDM model.bin test.txt output k

在原版的基础上新增了段落向量的功能，参考的论文是Distributed Representations of Sentences and Documents，https://arxiv.org/abs/1405.4053

文章里提出，除了词向量外，大家还期待得到phrase-level或者是 sentence-level的表示，比较常见的是通过weighted vector的叠加得到（缺失word顺序），还有一种比较复杂的，是通过解析树得到（只对sentence-level的有效，因为是要依靠解析树）。

PV-DM

Distributed Representations of Sentences and Documents(PV-DM,下同）的做法是在原先的预测任务中新增一个表示段落的向量，原先的模型是用前三个单词预测第四个单词，后面改为表示段落的向量+前三个单词一起预测第四个向量。整个段落中对应的段落向量是相同的，随着滑动窗口一起滑动，但是段落对应的向量不在段落间共享，但是词汇对应的向量是在段落间共享的，也就是说，所有段落对应的同一个词汇的向量是一致的。

这个算法一共分为2步，对于已知的段落，在训练过程中得到词向量W,层次softmax参数U,b,和段落向量D，对于未知段落，保持W,U,b不变的情况下，增加在D中的新的column，并且梯度下降至收敛。

PVDBOW

另一种做法就是在输入中不使用word，但是让模型去预测从段落中随机采样出来的词。从text window中随机采样出一个词，然后根据段落向量做分类任务。这有点类似于skip-gram。

效果的话：PV-DM的结果已经非常好了，但是如果加上PVDBOW的话，效果就更好了，因此强烈推荐。

实验结果：

1.使用PV-DM的结果比PVDBOW结果好，但是两者结合起来效果更好

2.concat比sum结果更好

3.调整window size，会使得结果表现更好

4.段落向量虽然费时，但是可以在测试的时候并行跑出来。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
FastText-PVDM，Distributed Representations of Sentences and

https://github.com/aiweiw/fasttext-PVDM
复制链接

扫一扫

专栏目录

薇酱 CSDN认证博客专家 CSDN认证企业博客

码龄10年

66: 原创

40万+: 周排名

3万+: 总排名

17万+: 访问

: 等级

1922: 积分

172: 粉丝

290: 获赞

17: 评论

533: 收藏

私信

关注

热门文章

分类专栏

学习框架 6篇
跟着chatgpt一起学 12篇
深度学习 9篇
经典算法介绍 9篇
AIGC 4篇
excel 1篇
Hadoop 2篇
问题解决 8篇
机器学习 12篇
算法 4篇
hive 4篇
poj水题 16篇
环境问题 2篇
python第三方库 2篇
spark 2篇
NLP 5篇

最新评论

分布式执行引擎ray入门--（1）简介
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
半监督短语挖掘：autophrase是什么？
薇酱: pages-articles.xml.bz2，这个在git上有说，https://github.com/kno10/WikipediaEntities
半监督短语挖掘：autophrase是什么？
lily_d_nlp_mt_istic: 你好，请问wiki数据用哪一个
图片是如何生成的--图像生成模型（GAN、VAE、扩散模型）简介
薇酱: GAN的可解释性通常较差，主要原因是它们的训练过程是一种黑箱操作。在训练GAN时，我们通常只关心生成器是否可以生成出与真实数据类似的数据，而不关心潜在空间中的变量到底代表了什么。因此，GAN的潜在空间通常没有明确的语义解释。另一方面，VAE的可解释性通常较好。VAE是一种基于概率的生成模型，它们的训练过程涉及到对潜在变量的后验分布进行建模。因此，我们可以通过观察和分析潜在变量的分布来理解模型的行为。此外，VAE的训练过程还包括一个重构误差项，这使得我们可以更好地理解潜在空间中的变量和它们如何影响生成的数据。 --以上回答来源于chatgpt，希望能帮到你
图片是如何生成的--图像生成模型（GAN、VAE、扩散模型）简介
不知道取啥名好: 大佬能请教你一下为什么是说gan模型可解释性不如VAE

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。