dx199771
码龄5年
关注
提问 私信
  • 博客:94,213
    94,213
    总访问量
  • 9
    原创
  • 1,958,068
    排名
  • 25
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:英国
  • 加入CSDN时间: 2019-12-09
博客简介:

dx199771的博客

查看详细资料
个人成就
  • 获得62次点赞
  • 内容获得17次评论
  • 获得304次收藏
创作历程
  • 4篇
    2021年
  • 5篇
    2020年
成就勋章
TA的专栏
  • 数字图像处理
    4篇
  • 图像特征描述
    4篇
  • GAN
    2篇
  • 图像预处理
    1篇
兴趣领域 设置
  • 人工智能
    opencv计算机视觉机器学习深度学习神经网络tensorflow图像处理
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

特征提取算法——HOG (Histogram of Gradient)方向梯度直方图学习笔记

今天介绍一种图像特征提取算法:HOG(Histogram of Gradient)方向梯度直方图HOG+SVM广泛运用与行人检测,在CVPR2005这篇文章中,实施HOG算法一共有5个步骤。1. 伽马/颜色标准化(Gamma/Colour Normalization)第一步应对图像进行伽马矫正和颜色空间标准化的预处理,此步的目的是为了减少光照的影响。颜色空间标准化中,Dalal等人的论文中分别使用了RGB,LAB和灰度等颜色空间对图像进行预处理,但对最终结果影响并不大,灰度图像有微弱优势,所
原创
发布博客 2021.07.17 ·
1946 阅读 ·
3 点赞 ·
1 评论 ·
6 收藏

字体生成GAN(GlyphGAN)学习笔记

最近一直在看GAN的论文,学校事情很多就不一一做笔记了。今天看到了一个很有趣的字体生成GAN,简单说一说,但很遗憾GlyphGAN只用来生成英文字母。GAN字体生成也有很过相关研究,包括最早的基于实例的方法,神经字体风格转换(Neural font style transfer),贝叶斯程序学习(Bayesian program learning),和最近大火的GAN(对抗生成网络)包括zi2zi,AC-GAN,domain transfer network,U-NET 生成器的变体和与LSTM结合
原创
发布博客 2021.02.25 ·
1639 阅读 ·
1 点赞 ·
1 评论 ·
6 收藏

SA-GAN(Self-Attention GAN)学习笔记

在做text2image GAN时候做文献阅读时看到的SAGAN,这里做一个简要得学习笔记,欢迎纠错讨论。Self-Attention Generative Adversarial Networks (SAGAN)SAGAN在ImageNet可到达36.8的Inception Score 和 18.65的Frechet Inception Distance。也是BIG-GAN的原型。传统卷积GAN问题:受局部感受野限制(Local Receptive Field),无法提取全局信息,只能提取
原创
发布博客 2021.02.21 ·
3925 阅读 ·
2 点赞 ·
9 评论 ·
5 收藏

特征提取算法——BRISK(Binary Robust Invariant Scalable Kepoints)学习笔记

今天介绍一种特征提取算法:BRISK(Binary Robust Invariant Scalable Kepoints)BRISK是Stefan等人在ICCV11上发表的。通过对原论文进行泛读后,对该算法有了一定的了解。原论文地址如下:https://www.researchgate.net/profile/Roland_Siegwart/publication/221110715_BRISK_Binary_Robust_invariant_scalable_keypoints/links/0
原创
发布博客 2021.01.02 ·
2246 阅读 ·
2 点赞 ·
0 评论 ·
12 收藏

图像插值算法——双立方(三次)卷积插值

双立方(三次)卷积插值是一种数据点插值方法。在对图像进行缩放,旋转等处理时,有些像素点会因为这些操作变得没有意义,比如二维图像A(2*2)放大为原来的二倍后B(4*4)就会缺失一些像素,如图所示: 图中白色区域就应进行插值操作。对比双线性插值和最近邻插值,双立方(三次)卷积插值具有更平滑的插值效果,但速度更慢,本文将对他进行介绍。原论文地址:http://ncorr.com/download/publications/keysbicubic.pd...
原创
发布博客 2020.12.30 ·
10610 阅读 ·
11 点赞 ·
2 评论 ·
57 收藏

梯度和梯度算子(Roberts,Sobel,Laplace)

机器学习和深度学习中,梯度是一个很重要的概念。在大部分机器学习优化问题中都可以通过梯度下降法处理。要介绍梯度就必须了解导数(derivative),偏导数(partial derivative)和方向导数(directional derivative)。这些概念在高等数学中都有介绍,也可以参考百度和维基百科,这里我们就只做简单回忆:导数导数反映函数在某点处沿x轴正方向的变化率,可以理解为,如果某点导数大于0,则该点沿x轴正方向递增,如果某点小于0,则递减。偏导数导数和偏导数性质一致,但偏导数
原创
发布博客 2020.12.27 ·
40075 阅读 ·
16 点赞 ·
3 评论 ·
101 收藏

伽马矫正(Gamma correction)

伽马矫正(Gammacorrection)在学习HOG描述子时,对图像进行预处理中使用了伽马矫正这个方法,这里对伽马矫正进行简要的介绍。伽马矫正也称幂律变换,一般用于平滑的扩展暗调的细节。进行伽马矫正的原因是因为人类的眼睛在感知光线时,眼睛对亮度的感知遵循近似的幂函数(如下图所示)而不是线性函数。计算机系统中,由于显示器或显卡的原因会出现实际输出图像有亮度偏差。在第一次进入一些游戏时,想必大家都经历过调节屏幕亮度参数直至能看清底部图片的操作吧,这也伽马矫正的一种。从图像中可以看出,当输.
原创
发布博客 2020.12.22 ·
11031 阅读 ·
9 点赞 ·
1 评论 ·
54 收藏

数字图像处理-图像滤波(1)-均值滤波

图像滤波,即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,是图像预处理中不可缺少的操作。在进行图像算法前,对图像进行滤波预处理往往会带来更好的效果。大家在用美图秀秀美颜皮肤时是否想过其中的工作原理,或者在Photoshop中是否使用过模糊这个功能?这其中都应用到了图像滤波的原理。图像滤波原理很简单,掌握了其中的卷积操作,也会对卷积神经网络的学习有一定帮助。滤波有很多类型,包括线性滤波和非线性滤波,今天主要介绍线性滤波中的均值滤波。均值滤波(Mean filter)先看一组滤波前
原创
发布博客 2020.11.17 ·
18868 阅读 ·
15 点赞 ·
0 评论 ·
35 收藏

特征提取算法——LBP(Local Binary Pattern)局部二值模式学习笔记

在上Computer Vision lecture的时候,讲师介绍了LBP算子,这里对他进行简单的介绍。LBP(Local Binary Pattern) 局部二制模式,是描述图像局部纹理特征的算子,有原始LBP,圆形LBP算子,旋转不变的LBP模式和LBP均匀模式。1. 原始的LBP原始LBP很好理解,是通过以中心像素为阈值对比中心像素和周围8个像素的值,周围像素比中心像素大(或相等的)的记为1,小的记为0,通过对比会得到二值图,按顺时针方向可得二进制串,再通过二进制转换为十进制数,即得到中心
原创
发布博客 2020.11.16 ·
3256 阅读 ·
3 点赞 ·
0 评论 ·
27 收藏