🚀 优质资源分享 🚀
学习路线指引(点击解锁) | 知识定位 | 人群定位 |
---|---|---|
🧡 Python实战微信订餐小程序 🧡 | 进阶级 | 本课程是python flask+微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一个全栈订餐系统。 |
💛Python量化交易实战💛 | 入门级 | 手把手带你打造一个易扩展、更安全、效率更高的量化交易系统 |
论文信息
论文标题:Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering论文作者:Bo Yang, Xiao Fu, Nicholas D. Sidiropoulos, Mingyi Hong论文来源:2016, ICML论文地址:download 论文代码:download
1 Introduction
为了恢复“聚类友好”的潜在表示并更好地聚类数据,我们提出了一种联合 DR (dimensionality reduction) 和 K-means 的聚类方法,通过学习深度神经网络(DNN)来实现 DR。
2 Background and Related Works
2.1 Kmeans
给定样本集 {xi}i=1,…,N{xi}i=1,…,N\left{\boldsymbol{x}_{i}\right}_{i=1, \ldots, N} ,xi∈RMxi∈RM\boldsymbol{x}_{i} \in \mathbb{R}^{M}。聚类的任务是将 NNN 个数据样本分成 KKK 类。
K-Means 优化的是下述损失函数:
minM∈RM×K,{si∈RK} s.t. ∑Ni=1∥xi−Msi∥22sj,i∈{0,1},1Tsi=1∀i,j,(1)minM∈RM×K,{si∈RK}∑i=1N‖xi−Msi‖22 s.t. sj,i∈{0,1},1Tsi=1∀i,j,(1)\begin{array}{l}\underset{\boldsymbol{M} \in \mathbb{R}^{M \times K},\left{\boldsymbol{s}_{i} \in \mathbb{R}^{K}\right}}{\text{min}} \quad & \sum_{i=1}^{N}\left|\boldsymbol{x}_{i}-\boldsymbol{M} \boldsymbol{s}_{i}\right|_{2}^{2} \\text { s.t. } & s_{j, i} \in{0,1}, \mathbf{1}^{T} \boldsymbol{s}_{i}=1 \quad \forall i, j,\end{array} \quad\quad\quad(1)
其中,
-
- sisi\boldsymbol{s}_{i} 是样本 xixix_i 的聚类分配向量;
- sj,isj,is_{j, i} 是 sisi\boldsymbol{s}_{i} 的第 jjj 个元素;
- mkmk\boldsymbol{m}_{k} 代表着第 kkk 个
- sisi\boldsymbol{s}_{i} 是样本 xixix_i 的聚类分配向量;