【机器学习】tensorflow: 稀疏自编码

最新推荐文章于 2020-05-30 22:02:00 发布

artzers

最新推荐文章于 2020-05-30 22:02:00 发布

阅读量3.5k

点赞数

分类专栏：图像处理数据挖掘综合算法模式识别与机器学习 python 文章标签：编码数据压缩机器学习大数据

本文链接：https://blog.csdn.net/lpsl1882/article/details/55096019

版权

模式识别与机器学习同时被 3 个专栏收录

46 篇文章 6 订阅

订阅专栏

python

32 篇文章 2 订阅

订阅专栏

图像处理

29 篇文章 2 订阅

订阅专栏

21世纪之后，数学家证明了我们获取的很多数据，可以分解为空间中少数几个基的组合，且组合系数很多为0；亦或者说，大部分数据的主要内容可以由少数几个空间基组成。这就是数据的稀疏特征，是压缩感知的基础。基于这个原理诞生了数据压缩方法，检测方法。这些方法很多都基于最优化理论，在大数据处理上，相比传统的方法，比如PCA，在计算复杂度上有很大的提升。稀疏自编码是其中一种数据压缩方法。
稀疏编码的公式为:

a r g m i n J = 1 2 (I - A X) 2 + λ | A |

$argmin J = \frac{1}{2}(I-AX)^2+\lambda|A|$ A和X都是需要优化的项。设原图大小为mxn，我们认为的基的个数为l，那么A大小为mxl，X大小为lxn,A和X都未知，这是一个双盲优化问题。其中L1正则化用于优化基，其实也可以用L2正则化来算，收敛的要快一些。下面是L2正则化的代码：

def getloss(latent):
    with tf.device('/cpu:0'):
        initial = tf.random_normal([252,latent]) * 0.256
        A = tf.Variable(initial)
        initial = tf.random_normal([latent,252]) * 0.256
        Phi = tf.Variable(initial)
        IMG=tf.placeholder("float", shape=[252,252])
        mu = 0.0001
        sparse = tf.matmul(A,Phi)
        #print(sparse.get_shape())
        loss = sparse - IMG
        loss = tf.reshape(loss,[252*252,-1])
        A_ravel = tf.reshape(A,[latent*252,-1])
        loss = 1./(252.*252.)*tf.nn.l2_loss(loss)
        regloss = loss+mu*tf.reduce_mean(tf.abs(A_ravel))#L1#tf.nn.l2_loss(A_ravel)#L2
        return regloss,loss,IMG,sparse

然后分别设latent为20和50，得到结果
这里写图片描述
源码:https://github.com/artzers/MachineLearning/blob/master/Tensorflow/SparseCode.ipynb

artzers

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】tensorflow: 稀疏自编码

21世纪之后，数学家证明了我们获取的很多数据，可以分解为空间中少数几个基的组合，且组合系数很多为0；亦或者说，大部分数据的主要内容可以由少数几个空间基组成。这就是数据的稀疏特征，是压缩感知的基础。基于这个原理诞生了数据压缩方法，检测方法。这些方法很多都基于最优化理论，在大数据处理上，相比传统的方法，比如PCA，在计算复杂度上有很大的提升。稀疏自编码是其中一种数据压缩方法。稀疏编码的公式为:arg
复制链接

扫一扫

专栏目录