![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图像处理
文章平均质量分 91
MezereonXP
A developer ,love life, love saber
展开
-
针对语义分割的真实世界的对抗样本攻击
针对语义分割的真实世界的对抗样本攻击来自于论文"Evaluating the Robustness of Semantic Segmentation for Autonomous Driving against Real-World Adversarial Patch Attacks"代码在[github](https://github. com/retis-ai/SemSegAdvPatch)有开源,各位感兴趣的可以自己去跑跑看。文章的主要贡献:提出了一种像素级别的交叉熵误差,用于生成强大的原创 2022-05-22 21:36:06 · 782 阅读 · 0 评论 -
基于白盒表征的图像卡通化
取自CVPR2020的一篇文章Learning to Cartoonize Using White-box Cartoon Representations图像卡通化,即是将自然拍摄到的图片转化成卡通风格的图片,属于一种风格迁移。如上图所示,左图为真实图片,右图为卡通化的结果。风格迁移很久之前就被人提出来了,比如2016年BAIR实验室提出来的Pix2Pix,以及之后针对非pair数据所提出来的CycleGAN。Pix2Pix文章: Image-to-Image Translation with原创 2021-03-15 15:23:06 · 537 阅读 · 0 评论 -
IDA-3D技术细节分析
IDA-3D技术细节分析这里主要针对其实例视差深度估计, Instance Disparity Depth Estimation进行分析如上图所示,其流程为:输入左右眼的图片分别通过Stereo RCNN的Stereo RPN得到一堆Anchors,分为两支:利用MaskRCNN的ROI Align,之后过网络进行多个变量的回归,包括(2D box, 偏转角度,长宽高,2D的x和y坐标)通过IDA模块,即实例深度注意(Instance-Depth-Aware)的模块,然后单独对深度z进行回原创 2020-08-17 16:28:44 · 875 阅读 · 1 评论 -
KITTI数据集中的3D Detection数据集详情
数据集内容包含7481张训练图片以及7518张测试图片,一共有80256个标记物体并且测试模式包含普通的视角以及鸟瞰视角(Bird Eye’s View, BEV)任务这里主要针对Kitti数据集的3D检测任务,分为3类:(1)简单:最小的box高度为40px,不出现遮挡,最大box重叠比例为15%(2)中等:最小的box高度为25px,最多出现部分遮挡,最大box重叠比例为30%(3)困难:最小的box高度为25px,最多出现几乎完全遮挡,最大box重叠比例为50%算mAP的时候,对于Ca原创 2020-08-09 22:24:18 · 1223 阅读 · 0 评论 -
CVPR19-Deep Stacked Hierarchical Multi-patch Network for Image Deblurring论文复现
CVPR19-Deep Stacked Hierarchical Multi-patch Network for Image Deblurring论文复现该工作主要关注于利用深度网络来实现图片去模糊,这里我们针对GoPro数据集进行论文的复现。文章给出了一种新的模型架构,来学习不同层次上的特征,并实现去模糊的效果。首先这里我们给出整体模型的架构如上图所示,整个模型由4个编码解码器构成,自底向上进行传播。可以看到,从最下面的输入开始,我们将模糊的图片进行输入,会将图片分成8个区域,每个区域过编码器原创 2020-08-09 22:15:20 · 484 阅读 · 4 评论 -
EagleEye的特性分析
EagleEye是一个利用移动设备进行人脸识别的系统,在多人环境下,低像素的输入仍能够保持正确性这里关注的点分为两个部分: Content Adaptive pipeline selection Spatial Independence and Parallelism 内容自适应的流程选择(Content Adaptive pipeline selection) 这项技巧用于优化复杂的多DNN人脸识别pipeline的执行,并且还能保持高的正确率 ...原创 2020-07-22 16:48:36 · 515 阅读 · 0 评论 -
特征点追踪之LK光流法
一般而言,LK光流用于特征点的跟踪,即前一帧中的关键像素到当前帧所对应的位置LK光流会有一些假设:灰度不变假设:即真实世界的一个确定的点,反应到像素级别,其灰度是不变的微扰不变假设:即时间的微小扰动不会引起像素的剧烈变化空间一致假设:相同表面相邻的点具有相似的运动,像素级别时他们也比较接近基于前两个假设,便有如下约束方程I(x,y,z)=I(x+δx,y+δy,z+δz)I(x,y,z)=I(x+\delta x,y+\delta y,z+\delta z)I(x,y,z)=I(x+δx,y原创 2020-07-21 16:37:13 · 724 阅读 · 0 评论 -
图像增强的几个方法以及Matlab代码
1. 灰度线性变换灰度线性变换, 是一种空域的方法, 直接对每一个像素的灰度值进行操作假设图像为III则其中每一个像素点的灰度值为I(x,y)I(x,y)I(x,y)我们利用简单的线性变换可以得到:I(x,y)∗=k∗I(x,y)+bI(x,y)^*=k*I(x,y)+bI(x,y)∗=k∗I(x,y)+b取k=1,b=16k=1,b=16k=1,b=16可以得到这里给出关键代...原创 2018-09-24 23:39:55 · 43814 阅读 · 6 评论 -
Energy-efficient Amortized Inference with Cascaded Deep Classifiers论文笔记
Energy-efficient Amortized Inference with Cascaded Deep Classifiers论文笔记0. 概述深度神经网络在许多AI任务中取得了卓越的成功, 但是通常会造成高的计算量和能量耗费, 对于某些能量有约束的应用, 例如移动传感器等.我们提出了一种新的框架来, 该框架能够同时优化预测准确度以及能量耗费, 利用该框架来解决以上这个问题. 虽然该...原创 2018-10-16 23:24:03 · 393 阅读 · 0 评论