Co-regularized PLSA for Multi-view Clustering

最新推荐文章于 2024-06-14 20:45:17 发布

eshaokai

最新推荐文章于 2024-06-14 20:45:17 发布

阅读量711

点赞数 2

分类专栏： Clustering Multi-view PLSA 主题模型

Multi-view 同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

这篇文章是比较新的一篇Muti-view Clustering的文章，它提出了一个CO-PLSA的模型，将不同view下的PLSA模型整合起来。这篇文章的主要基本思想是在某一个view下，如果两篇文章在主题空间中相似，那么他们在其他view下的主题空间也将类似。

我们都知道通常的PLSA生成过程如下：

根据概率 p(di) 选择一篇文档 di 。
根据概率 p(zk|di) 选择一个隐藏主题 zk 。
根据概率 p(wj|zk) 生成一个词 wj 。

模型的联合概率分布:

p (d i, w j) = p (d i) p (w j | d i)

p (w j | d i) = \sum k = 1 K p (w j | z k) p (z k | d i)

写出似然函数

L (Ψ) = \sum i = 1 N \sum j = 1 M c (d i, w j) log p (d i, w j) \propto \sum i = 1 N \sum j = 1 M c (d i, w j) log \sum k = 1 K p (w j | z k) p (z k | d i)

而COPlSA的目标函数就是

O (Ψ v, Ψ w) = τ v L (Ψ v) + τ w L (Ψ w) - λ R

其中 L(Ψ) 是两个view下的似然函数, τv+τw=1 。而主要体现文章思想的地方就在这个 R 上， λ 是用来平衡权重的参数。见图：

这个pairwise co-regularization R是将二个独立的view连接起来的桥梁，它被定义为

R = ∥ S v - S w ∥ 2 F

其中 Svij 代表文档 i 和文档 j 在view V 下的相似度，相似度使用高斯核来衡量的。

S v i j = exp (- \sum k ( p v ( z k | d i ) - p v ( z k | d j ) ) 2 σ)

在求解的时候，这个目标函数最大化问题可以用以下相互迭代的方法来解决

固定 Ψw=Ψ^w ，解决问题 O(Ψv,Ψ^w) 。
固定 Ψv=Ψ^v ，解决问题 O(Ψ^v,Ψw) 。

解决具体问题的时候使用的是EM算法，就不详述了。

原来看这篇文章是想做内容和链接2个view的社区发现的，但是发现它的基本假设不一定相符，在内容和链接的2个view下数据是否有相似性还有待讨论。

参考文献：

1 Jiang,Y., Liu, J., Li, Z., Li, P., and Lu, H.: ‘Co-regularized PLSA for Multi-viewClustering’: ‘Computer Vision–ACCV 2012’ (Springer, 2013), pp. 202-213

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

eshaokai CSDN认证博客专家 CSDN认证企业博客

码龄15年

0: 原创

202万+: 周排名

160万+: 总排名

710: 访问

: 等级

11: 积分

0: 粉丝

2: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

Co-regularized PLSA for Multi-view Clustering 711

分类专栏

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。