换个角度看问题

横看成岭侧成峰,远近高低各不同,相信大家一定有过这样的感触,遇到问题时,到了山重水复疑无路的地步,换个角度,将问题从源域映射到目标域,问题迎刃而解,柳暗花明又一村,工作如此,学习,生活亦是如此,今天我讲几个这样的故事给大家听。

傅里叶变换:从频率域看问题

一段随时间变化的信号被称为时间域信号,例如一段声音,一张图像可以被看作是空间域信号,在信号的处理方法中,有一种滤波操作,用于去除噪声,例如,在数字图像处理中,有中值滤波,均值滤波,高斯滤波,拉普拉斯滤波等,但这几种滤波只考虑了某一像素周边邻域的几个像素点,并没有从全局角度去看图像,不妨换个角度去看待图像,从空间域转换倒频率域,这就是傅里叶变换。

在这里插入图片描述

图片

任何连续周期信号都可以由一组适当的正弦曲线组合而成,对于图像,每一行,每一列都可以看成周期信号的某一个周期,图像中的背景,连续的区域,变化缓慢,称之为低频部分,相反,边缘,噪声这些变换剧烈的地方称之为高频部分,傅里叶变换就是将图像变换到频率域,然后通过操作频谱图去掉高频,或者低频部分,实现高通滤波或者低通滤波器的作用;这种转换有点逆思维,因为频谱图的每一个点并不是与空间域的某个点一一对应的,而是每一个频谱图的点包含全部图像的信息。

高通滤波:

图片

低通滤波:

图片

带通滤波:

图片

特征维度:多一维真的不一样

在机器学习中,经常会用到一些分类模型,例如,逻辑回归,SVM等,当分类效果不理想时,首先想到的是优化模型,更换模型,使用深度神经网络,但有的时候,不妨换个角度,在数据特征方面做点文章。

在这里插入图片描述

图X1,如果只选择一个特征进行分类,数据线性不可分,找不到一个分界线和分界面能将正方形和三角形分开,但如果增加一个特征,在二维平面上可能就线性可分了。

更一般的,如果找不到其他特征,也可以尝试通过现有特征的组合或者变换来达到在高维度数据线性可分,例如增加一个特征x2 = (x1)2 ;下图中,非线性SVM就是利用多项式核,高斯RBF核将数据映射到高维空间进行分类。

在这里插入图片描述

坐标系:换个坐标系换个世界

无论是数字图像处理,还是计算机图形学,图像处理过程大多在笛卡尔坐标系下进行,这种坐标系直观,好理解,符合人类直觉。

在这里插入图片描述

除了笛卡尔坐标系外,还有一种坐标系也比较常用:极坐标系。
在这里插入图片描述

两种坐标系之间可以进行相互转换,霍夫直线检测就是利用了两个坐标系的转换关系。

在这里插入图片描述

笛卡尔坐标系中的一条直线对应霍夫空间的一个点

在这里插入图片描述

笛卡尔坐标系中的一个点对应霍夫空间一条直线。

在这里插入图片描述

笛卡尔坐标系中两个点在一条直线上,则这两个点在霍夫空间对应的两条直线相交于一点。

由于霍夫空间有缺陷,所以将霍夫空间换成极坐标系,换成极坐标后,直线变成曲线,但仍相交于一点的特性没变。

在这里插入图片描述

利用这种特性,当霍夫空间中一个点被经过的曲线越多,那就说明原空间中越多的点在同一条直线上,那就说明这条“直线”是直线的概率越大。

GAN:图像分割的新玩法

说到图像分割,首先会想到基于阈值的分割,基于边缘的分割,基于区域的分割,基于深度学习的分割,其中,基于深度学习的图像分割技术当下非常火热,大多模型都是基于全卷积网络,最近两年视觉Transformer大有反超CNN的趋势,两者你方唱罢我登场的时候,GAN网络也来图像分割领域分一杯羹,之所以说它,是因为GAN与前面提到的技术不同,前面的技术有可解释性,符合人们的直觉,但GAN优点反人类的意思,从不同的角度实现分割。

在这里插入图片描述

UNet网络U型左侧部分,先提取特征,且越靠近输入端的特征越抽象,抽象特征有边缘,颜色等,越靠近输出端,特征越具体,具体就是指与具体任务相关性越大,输出结果也是基于融合的特征图,根据特征去分割,这个很好理解,下面看一下GAN是怎么做的。

在这里插入图片描述

训练过程中,生成网络输出的结果并不是直接与标签计算损失函数,而是由判别网络来与生成网络进行博弈,直到两者都训练有素,训练完成后,生成网络作为预测模型生成分割结果。

矩阵:不只是一堆数字

一幅图像可以用一个二维的像素矩阵来表示,这个时候矩阵中的数字代表灰度值;但矩阵的作用不止于此,它可以作为一种变换,将图像或者向量从源线性空间变换到目标线性空间,图像矩阵中每个像素都有坐标(x,y,z),将变换矩阵作用于每一个像素点的坐标向量,这就是图像变换,例如,欧式变换,仿射变换,投影变换,单应变换,不同坐标系之间的转换等,这些变换都可以用一个变换矩阵来表示。

除了变换,利用矩阵本身的性质,也可以解决很多问题,例如,根据矩阵是否正定来判断方程是否有解,且解是否唯一,利用矩阵的逆来求方程的解,利用矩阵的特征值分解,奇异值分解来进行主成分分析,进而达到数据降维的目的,除此之外,机器学习中的目标函数优化方法也可以用牛顿法进行优化,牛顿法就是利用矩阵的一阶导数矩阵和Hession矩阵进行求解。

旋转矩阵:

在这里插入图片描述

在这里插入图片描述

齐次坐标:实现大一统

矩阵变换中平移是一个异类,齐次坐标的出现是为了将平移,旋转,缩放变换矩阵统一到一个矩阵中,其本质也是将低维空间解决不了的问题,转换到高维空间。
在这里插入图片描述

这样的例子还有很多,写这篇文章的目的也是希望大家在遇到问题时,踟蹰不前,抓耳挠腮时,不妨换个思路,人生处处是风景。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值