自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

专注人工智能,主攻CV

记录所见所思所得

  • 博客(36)
  • 资源 (1)
  • 收藏
  • 关注

原创 【统计学】独立同分布

独立同分布是统计学中的一个重要概念,指的是在概率论和统计学中常见的一种假设,即一组随机变量之间相互独立,并且具有相同的概率分布。

2024-03-21 10:24:44 6427

原创 【机器学习】k近邻(k-nearest neighbor )算法

k近邻(k-nearest neighbors,KNN)算法是一种基本的监督学习算法,用于分类和回归问题。k值的选择、距离度量及分类决策规则是k近邻法的三个基本要素。

2024-03-20 22:34:10 933 2

原创 旷视low-level系列(三):NAFNet -- Simple Baselines for Image Restoration

题目:Simple Baselines for Image Restoration单位:旷视收录:ECCV2022。

2024-02-24 12:39:31 2514

原创 旷视low-level系列(二):Practical Deep Raw Image Denoising on Mobile Devices

业内周知,基于深度学习的去噪算法在效果上已经甩传统算法几条街了,但是由于模型计算量太大和设备算力不够等因素导致落地困难。为了解决上述问题,旷视的这篇论文提出了一个轻量级的、高效的神经网络去噪模型,能够在移动设备上流畅运行,并且能够获取高质量的去噪结果。

2024-02-01 19:11:57 1206 1

原创 旷视low-level系列(一):Bayer Pattern Unification and Bayer Preserving Augmentation

业内做AI-ISP的攻城狮们应该都会遇到这样一个问题,在适配不同sensor的过程中会积累大量具有不同Bayer模式的数据,然后在训练模型时都想用上,这时大家都会将这些异源的数据统一成相同的bayer模式,常用的操作有:① 在裁剪patch时根据目标bayer模式选择合适的起点;另外,数据增强是训练神经网络时提升性能的一种常用手段,对于RAW数据,为了避免破坏bayer模式,通常会选择在打包成4通道后再做翻转和旋转等增强。然而作者发现这样也会产生伪影,并提出了相应的解决方案。

2024-01-27 12:02:14 1066

原创 【低光去噪】Learnability Enhancement for Low-Light Raw Image Denoising: A Data Perspective

SNA的本质是增加配对数据在场景照度上的多样性,而照度决定了传感器接收的光子数,因此SNA是一种基于光子散射噪声模型的数据增强方法。有限的数据量、复杂的噪声模型和不完善的数据质量构成了配对数据之间映射的可学习性瓶颈,限制了learning-based方法的性能。对于SNA,由于真实配对数据毕竟是有限的,不能涵盖真实应用场景中的不同照度环境,并且在数据规模不大的情况下使用数据增强一般能够稳定提升神经网络的性能,在带噪声图像和干净图像上添加相应的增量能够显著增加真实配对数据的数据量。

2024-01-12 17:49:09 1423

原创 【低光去噪】Rethinking Noise Synthesis and Modeling in Raw Denoising

理解和分析Rethinking Noise Synthesis and Modeling in Raw Denoising

2023-12-22 11:18:13 1441

原创 如何使用python检验样本数据概率分布

python科学计算库scipy中提供了检验样本数据概率分布的api,在此对其使用方法做个简单记录,可分为形状参数已知和未知两种情况。

2023-12-20 17:27:02 603

原创 【YOLO系列】YOLO v1~v3论文阅读笔记

YOLO v1~v3都是由YOLO之父Joseph Redmon大神提出,YOLO v1首次将检测问题制定为回归问题,在此之前都是采用分类的方式来解决目标检测问题(例如RCNN系列),YOLO v1的最大优势就是速度快;v2在v1的基础上针对检测精度进行改进,v3结合当时一些新颖的技术对v2做了一些重要的改进,被作者谦虚地戏称为TECH REPORT。

2023-11-23 10:29:43 904

原创 【轻量级网络】华为诺亚:VanillaNet

随着人工智能芯片的发展,神经网络推理速度的瓶颈不再是FLOPs或参数量,因为现代GPU可以很容易地进行计算能力较强的并行计算。相比之下,神经网络复杂的设计和较大的深度阻碍了它们的速度。在此背景下,华为诺亚提出了极简网络架构VanillaNet,在ImageNet数据集上,深度为6的网络即可取得76.36%的精度,深度达到13时便能取得83.1%的精度!如果能够将深度训练和重参数化合理地结合起来,就是模型压缩利器,大有文章可做,挖个坑~

2023-06-01 20:42:58 1378

原创 【形形色色的卷积】差分卷积

普通卷积不能显式地提取图像的梯度信息,因此不能较好地描述细粒度的纹理信息,在人脸活体检测、边缘检测等对细粒度纹理信息敏感的任务中难以取得理想的结果。针对上述问题,Oulu大学的研究者们提出了一系列差分卷积,在人脸活体检测和边缘检测等任务中取得了很好的效果。

2023-05-28 17:43:19 4047

原创 【PyTorch】获取特征图并可视化

都说神经网络是个黑盒子,其内部具体的工作原理也模糊不清,但是,对卷积神经网络输出的特征图进行可视化能够大概地知悉网络每个阶段的作用,能够为网络设计提供一些思路。在此记录一下本人工作中常用的特征图提取和可视化方法。

2023-05-20 08:56:15 1070

原创 语义分割总结

语义分割是一种计算机视觉领域的图像分割技术,旨在将图像中的每个像素分配到其对应的语义类别中。与传统的图像分割技术不同,语义分割旨在对图像进行更精细的划分,以识别出图像中每个像素的语义含义。在语义分割中,每个像素被标记为属于一个预定义的语义类别,例如人、车、路、树等等。与此相比,传统的图像分割方法通常仅仅将图像分成前景和背景两个部分。语义分割可以应用于各种计算机视觉任务,如自动驾驶、目标检测、图像分析和医学图像分析等,常用的网络架构包括全卷积网络(FCN)、U-Net和SegNet等。

2023-05-07 19:08:18 1668

原创 【数字图像处理】边缘检测

边缘检测是一种图像处理技术,旨在标识和定位数字图像中的边缘和轮廓。边缘是图像中灰度值变化明显的位置,通常是物体的边缘或表面的变化。通过边缘检测算法,可以将图像中的物体和背景分离出来,从而实现目标检测、图像分割、计算机视觉和机器人视觉等应用。边缘检测算法的基本原理是在数字图像中寻找灰度变化的位置。其中,最常见的方法是基于图像梯度的边缘检测算法,如Sobel算子、Prewitt算子、Roberts算子和Canny算子等。

2023-05-05 22:51:39 2855

原创 【对比度增强】Learning Tone Curves for Local Image Enhancement(LTMNet)

LTMNet这篇文章借鉴了CLAHE算法,所有步骤与CLAHE一致,不同之处在于LTMNet中局部映射曲线是通过CNN预测得到,而CLAHE中是通过直方图均衡化而得。关于CLAHE,【数字图像处理】直方图均衡化这篇博客有简单介绍。传统算法与神经网络结合,神经网络拟合色调映射函数设计算法时要考虑到实际应用环境,如ISP pipline中,一个很重要的点就是算法需要具备可调性,因为用户需要针对自己的偏好以及使用环境的不同对算法的效果进行调整。

2023-04-22 22:00:15 1659 3

原创 重参数化技术(RepVGG, RepOptimizer)

一方面,大量研究表明,多分支网络架构的性能普遍优于单分支架构;另一方面,相比多分支架构,单分支架构更有利于部署。那么有没有可能训练时采用多分支架构,而推理时使用单分支呢?私以为,Re-parameterization is All You Need!!!

2023-04-16 11:02:14 4858

原创 【数字图像处理】空间滤波

空间滤波是一种基于像素点周围邻域像素灰度值的加权平均来处理图像的方法。该方法在图像处理领域被广泛应用,包括图像增强、去噪、边缘检测等方面。空间滤波可分为线性和非线性两种类型。线性滤波方法包括均值滤波、高斯滤波、中值滤波等,这些方法能够平滑图像,去除噪声,但会使得图像细节信息变得模糊。非线性滤波方法包括边缘保持滤波、非局部均值滤波等,这些方法能够更好地保持图像细节,但不能去除高斯噪声等平稳噪声。空间滤波的效果取决于滤波器的大小和权重系数的选择。

2023-04-13 22:32:54 2612

原创 【数字图像处理】直方图均衡化

综上所述,CLAHE 是一种比较优秀的图像增强算法,可以有效地保留图像的局部细节信息,但其计算量较大,对算法的参数设置较为敏感,需要进行合理的参数设置和优化。限制对比度自适应直方图均衡化(CLAHE)是一种改进的直方图均衡化算法,它通过在图像的局部区域内进行直方图均衡化,以保留图像的局部细节信息。直方图均衡化的目的是将一幅图像的直方图变成一个均匀分布的直方图,从而增强图像的对比度。总的来说,直方图均衡化的数学原理就是通过对原始图像的直方图进行变换,将其变成一个均匀分布的直方图,从而增强图像的对比度。

2023-04-12 22:26:25 16589 3

原创 【低光去噪】理解ELD(Physics-based Noise Modeling for Extreme Low-light Photography)

一句话总结:使用改论文提出的噪声生成模型合成数据所训练出的模型,其网络去噪能力可以媲美用大量配对数据训练的模型,避免费时费力地采集大量真实配对数据。

2023-03-27 23:11:34 1960 4

原创 【HDR】曝光融合(Exposure Fusion)

在曝光融合(Exposure Fusion)算法问世之前,多曝光序列合成用于显示的HDR需要两个步骤,第一步是将多张不同曝光的低动态范围图像合成为HDR(例如Debevec提出的加权融合方法),通常HDR为12bit或者16bit;第二步是通过tonemapping对高动态范围HDR进行压缩以支持低动态范围显示设备(例如Durand提出的基于双边滤波的tonemapping算法),一般会压缩至8bit。

2022-12-22 16:11:37 9263

原创 【低光增强】Zero-DCE

提出了第一个不需要成对训练数据的低光增强网络,避免过拟合风险,在不同光照条件下泛化良好;设计了一种逐像素高阶曲线,通过多次反复迭代可以有效地在宽动态范围中执行亮度映射;展现了在缺少参考图像的情况下通过无参考损失函数训练图像增强网络的潜力;所提出的Zero-DCE网络可以在减小计算量的同时保持增强能力,提供了多种选择以平衡增强能力和计算开销。

2022-11-30 22:12:13 4648 20

原创 【HDR】Deep high dynamic range imaging of dynamic scenes

- 首次提出使用机器学习方法从一组包围曝光的LDR图像中重建HDR图像 - 构建了第一个适合于学习HDR重建的数据集,并详细介绍了构建方法

2022-11-21 19:28:52 963

原创 【HDR】AHDRNet: Attention-guided Network for Ghost-free High Dynamic Range Imaging

目前,高动态范围成像算法面临的主要挑战是:用于合成HDR图像的多帧LDR图像之间存在物体位移,大幅度运动的对齐比较困难,从而导致合成后的HDR中存在伪影。

2022-11-19 14:27:43 1926

原创 Ubuntu22.04安装CUDA和cuDNN详细过程记录

Ubuntu22.04安装CUDA和cuDNN详细过程记录

2022-11-05 20:06:51 44635 22

原创 注意力机制总结

论文:论文:论文:X∈RH′×W′×C′U∈RH×W×CU∈RH×W×CUU^U∈RH×W×CS∈RCZ∈RdZA∈RC×dB∈RC×da∈RCb∈RCabUU^ab1UU。

2022-10-28 10:37:29 6463 1

原创 轻量级网络总结

总结轻量级网络设计思想

2022-10-28 10:36:47 6499 10

原创 轻量级年龄估计模型--C3AE(旷视研究院)

轻量级年龄估计模型--C3AE(旷视研究院)

2022-10-27 22:56:51 912

原创 AI抠图算法总结

AI抠图

2022-10-08 23:00:02 3600

原创 简单快速地搭建深度学习环境

简单快速地搭建深度学习环境

2022-09-20 22:19:41 602

原创 CNN可视化技术 -- CAM & Grad-CAM详解及pytorch简洁实现

CNN中的特征图可视化大体可分为两类:第一类方法只显示了在深层特征中保留了哪些信息,而没有突出显示这些信息的相对重要性。第二类方法则具有一定的解释性,例如在分类任务中,通过CAM能够解释模型究竟是通过重点学习哪些信息来判断类别的。.......................................

2022-06-28 20:33:05 6293 11

原创 CuPy:加速Numpy中的矩阵运算

前言在计算机视觉任务中,经常要使用python中的numpy模块对图像进行预处理,但是numpy是通过调用cpu进行运算,在运算速度上相比gpu还是逊色不少。恰巧,笔者在工作中遇到了强化学习中的environment在返回state和reward时占用了大量的训练时间这样的问题。将代码中的numpy替换为cupy后,网络的训练速度提升了近40倍,直接起飞~Numpy vs CuPyimport numpy as npimport cupy as cpimport timearray_np =

2022-05-12 10:01:51 911

原创 python:根据一个列表对另外一个列表排序

在使用python处理数据时可能会遇到根据列表A对列表B进行排序的问题,记录一下想到的两个方法。方法1:根据列表b中每个元素的下标来获取列表a中对应位置的元素,将其作为排序依据即可。import randoma = [x for x in range(5)]b = [x for x in range(5,10)]random.shuffle(a)random.shuffle(b)print(a)print(b)# sort list b by list asorted_b =

2022-05-11 17:35:35 7133 1

原创 强化学习: Policy Gradient

强化学习--策略梯度(Policy G)

2022-04-16 15:07:13 3472

原创 python脚本--批量下载GNSS数据

1 前言2020年7月19日,应某一大佬要求,为其写一个用于批量下载GNSS数据的脚本。恰好前几天研究过如何在教务系统中自动签到,便有了这篇博文,希望能够为下载数据的各位GNSSer提供一些参考。2 思路使用selenium模块实现模拟登录,定位到下载数据的页面,并获取网页源码;通过re模块(正则表达式)实现网页源码中数据压缩包名称的爬取;匹配需要下载的测站和爬取得到的测站,提取能够下载的站点数据包名称;根据站点数据包名称遍历下载。3. Talk is cheap运行环境:python3

2020-07-19 16:41:41 1591 2

原创 Matlab GUI设计之坐标转换(附Matlab GUI设计学习手册完整版pdf)

相信看这篇文章的你们大部分没有用Matlab做过界面设计,其实不只是你们,我也是第一次(手动滑稽),在此将我的经验同大家一起分享。如何开始?就如哲学家斯宾塞所言:“每一件美好的事情,开始都是很困难的”。编程也是一件美好的事情,而如何开始动手去想,去构思,去编写代码,这些对于新手而言无一不是困难的。其实,编程的大部分工作在于构思。如果你拿到一个问题,在脑中或者是草稿纸上将整体的框架列出来,这个问...

2019-03-27 21:36:38 5005 7

原创 使用matlab绘制世界地图并根据经纬度绘制点位(附m_map的下载与安装说明)

使用matlab绘制世界地图有两种方法(自己使用过的,可能有别的我不了解的方法):第一种是worldmap和geoshow;第二种是利用m_map工具箱;下面分别介绍这两种方法。1.worldmap & geoshowworldmap和geoshow是matlab中绘图工具箱的两个绘图函数,直接调用即可。worldmap的语法:worldmap region %r...

2019-03-26 17:07:56 73583 9

matlab GUI设计 大地坐标和空间直角坐标相互转换

利用matlab写的坐标转换界面程序,可以实现同一椭球基准下大地坐标和空间直角坐标之间的转换,提供4种椭球参数的选择

2019-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除