深度学习——深度聚类小调研

最新推荐文章于 2024-05-23 10:13:16 发布

无意识积累中

最新推荐文章于 2024-05-23 10:13:16 发布

阅读量6.6k

点赞数 13

分类专栏：深度学习基础

本文链接：https://blog.csdn.net/weiwei935707936/article/details/102305692

版权

深度学习基础专栏收录该内容

45 篇文章 5 订阅

订阅专栏

深度聚类文章集锦：https://www.ctolib.com/zhoushengisnoob-DeepClustering.html

先说说自己跑题的一点感想：

在查阅资料，读survey的时候会很烦躁，有种不想做的感觉。然后，就开始怀疑自我：自己到底有没有能力，是不是不适合云云......

其实，都这么多年了，对学习这件事你的内心应该更加强大才是......

现在我们就来分析一下这件事，以便以后稳定心性+提升学习效率。

入门一个知识内容十分丰富的领域，本来就是一件会产生些许焦虑，烦躁，惶恐的事情......
科研：语言不熟，文章装×，网上辅助资料少+没老师+没体系......可能你花费大量时间，最后能够积累下来的有用的知识却是微乎其微。
长时间低效积累+要自己探索并创造=想放弃（学走都难，还想飞？这给人直接的信号就是——不可能）
但是！！！还是那句话“这么多年了，事实你还不知道吗？”——高效学习=掌握套路+把握重点
要坚信：世界上所有的知识，真正掌握时一定很简单！

那么，没怎么改才能让自己下次不崩溃？

要承认，科研确实要具备一定素质才能做。不要老想着一蹴而就，夯实基础和锻炼能力是前期要务：

1.数学：小的，常用的知识点很多。平时攒下来，找个时间集中攻破应该很快乐。

2.代码：听代码大佬说的：代码就像cache......(你懂得)

3.文章：（套路可能已经上路了，补充一点）

最根本的方法在一个领域里应该只有几个。看大家弄得热闹，其实就多几个小trick，填些小部件罢了。

4.英语：专业名字和用法来来去去应该就那么几个。

大的行事方针：

1.紧跟你的主要课题，不要老换。

2.前期还是一个文章，一个文章的积累。（但要思考自己怎么用）

3.很经典的方法一定要总结，熟练。（变成自己的思考而不是记录在案的东西）

4.概览文章，先跑代码，再细究？

嗯，先这些，有啥想法再说。

对于深度聚类一些傻里傻气的，肤浅的认识：

1.最多的就是：k-means+深度网络

2.用得很普遍：自编码器聚类

3.其他大类：（谱聚类|层次聚类|DBSCAN......)+深度网络

4.下面IIC(牛津大学) 和 CDP（商汤）比较新颖

想入门这个领域的“踏踏实实”的路线：

1.B站视频：（虽然四个，但是一套，可解上1,3）

https://www.bilibili.com/video/av68875578/?p=8

https://www.bilibili.com/video/av68876501?from=search&seid=8887334697187585982

https://www.bilibili.com/video/av68877650

https://www.bilibili.com/video/av68879134/?redirectFrom=h5

2.A Hybrid Autoencoder Network for Unsupervised Image Clustering应该会囊括几个自编码器的（诶，没代码，待定）

3.上面4的两篇文章可以瞄一下。

IIC:Invariant Information Clustering：牛津大学不变信息聚类

本文特点：

没有强行结合传统聚类和深度网络。
没有PCA和白化。
只是稍稍改动CNN。
用互信息最大化目标函数+双输入（一个CNN,只是把图片平移、旋转或crop。进行两次正向传播+一次反向传播）

原文链接：Invariant Information Clustering for Unsupervised Image Classification and Segmentation （https://arxiv.org/pdf/1807.06653.pdf）

代码链接：https://github.com/xu-ji/IIC

CDP:Consensus-Driven Propagation in Massive Unlabeled Data for Face Recognition(一种有监督的Metric用于人脸聚类，来部分解决无标注数据内部结构复杂、依赖特定Metric、缺乏Outlier控制，以及时间复杂度等问题)

文章解决的主要问题：

文章原理简述：

文章结果：

文章链接：https://arxiv.org/pdf/1809.01407.pdf

代码链接：https://github.com/XiaohangZhan/cdp

Deep Clustering for Unsupervised Learning of Visual Features

A Hybrid Autoencoder Network for Unsupervised Image Clustering

把现有的几种AutoEncoder结合了一下
没代码
可以学到聚类比较基础的入门知识（如 :评价指标，自动编码器聚类的套路等等）

Deep Clustering with Convolutional Autoencoders

Keras代码
原来的方法没有很好地利用CNN和特征空间的数据的结构？

SPECTRAL NET: SPECTRAL CLUSTERING USING DEEP NEURAL NETWORKS（耶鲁大学谱聚类）

谱聚类的局限性：它的主要局限性是规范嵌入的可扩展性和泛化性。（这篇文章就是用来提升的，很玄妙）
Tensorflow代码：https://github.com/kstant0725/SpectralNet
文章链接：chrome-extension://ikhdkkncnoglghljlkmcimlnlhkeamad/pdf-viewer/web/viewer.html?file=https%3A%2F%2Fopenreview.net%2Fpdf%3Fid%3DHJ_aoCyRZ

Subspace clustering using a low-rank constrained autoencoder

子空间聚类的一个改进
无代码

无意识积累中

关注

13
点赞
踩
79

收藏

觉得还不错? 一键收藏
6
评论
深度学习——深度聚类小调研

深度聚类文章集锦：https://www.ctolib.com/zhoushengisnoob-DeepClustering.html先说说自己跑题的一点感想：在查阅资料，读survey的时候会很烦躁，有种不想做的感觉。然后，就开始怀疑自我：自己到底有没有能力，是不是不适合云云......其实，都这么多年了，对学习这件事你的内心应该更加强大才是......现在我们就来分析一下这件事...
复制链接

扫一扫