![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
Camellia@
Shall we drink a cup of coffe?
展开
-
One Pixel Attack for Fooling DNN 对抗样本单像素攻击
One Pixel Attack for Fooling DNN 对抗样本单像素攻击2019 One Pixel Attack for Fooling DNN1.前言通过在图像中添加一些人眼无法识别的扰动,可以使分类器分类对抗图片错误。在这篇文章中,作者认为分析DNN的分类边界的集合特征也能够帮助理解DNN的分类特性。以往的工作对这方面的研究相对较少,是因为理解高维空间的几何特征相对困难。然而,DNN相对于对抗性扰动的鲁棒性评估可能有助于解决这个复杂的问题。论文中使用差分进化提出一种单像素的黑盒攻原创 2022-01-18 05:48:47 · 4544 阅读 · 1 评论 -
平移不变性
不变性虽然目标发生了变化,但是你还是可以把他识别出来。这对图像分类来说是个很好的特性,因为我们希望图像中目标无论是被平移,被旋转,还是被缩放,甚至是不同的光照条件、视角,都可以被成功地识别出来。平移不变性:Translation Invariance旋转/视角不变性:Ratation/Viewpoint Invariance尺度不变性:Size Invariance光照不变性:Illumination Invariance平移不变性/平移同变性在欧几里得几何中,平移是一种几何变换,表示把一原创 2021-12-15 23:09:24 · 542 阅读 · 0 评论 -
如何读论文
最近看论文比较浮躁,也不知道该怎么着手,读的时候也不知道侧重点在哪里,所以去B站听了一下李沐老师的方法介绍,希望对自己有所帮助。(小声逼逼,最近考试好多呜呜呜来自李沐老师→【论文精读】文章分为1、标题2、作者3、摘要4.简单介绍5、方法6、方法的可执行性7、总结怎么进行论文的筛选从而获取自己最想精读的文章?第一遍(海选:①先关注文章的标题和摘要②跳到结论确定论文title啥意思,是否与你相关③看看文章中的图表可以大概知道文章讲些什么方法,是否适合你需要寻找的方法-原创 2021-12-03 17:51:20 · 2237 阅读 · 0 评论 -
Zero shot learning
Zero shot learning主要考察的问题是如何建立语义和视觉特征的关系(视觉特征一般用预训练好的CNN提取特征,不再进行fine-tine)为了预测从未在训练集上出现的目标种类,仿照人的思维迁移,能根据某些特征描述(他和谁长得像,有点类似于科学家第一次看见鸭嘴兽的感觉),猜测一个从未见过的目标种类。Zero shot learning:假设斑马是未见过的类别,但根据描述和过去知识的印象即马(和马相似)、老虎(有条纹)、熊猫(颜色)相似进行推理出斑马的具体形态,从而能对新对象进行辨认。零原创 2021-12-02 09:15:15 · 3251 阅读 · 0 评论 -
目标检测的一些基本概念
暑假的时候对目标检测做了些研究,没有发什么博客,现在是整理了一下自己的笔记,主要是在吴恩达视频讲解的目标检测以及一些自己的理解,我之前在网上有找到一个目标检测过程的动图解析,觉得挺好的但是!我找不到链接了,如果uu们不能理解过程建议多去找找相关的介绍。顺便建议大家去看看气泡大大的博客和视频讲解,气泡大大,我的超人!https://blog.csdn.net/weixin_44791964/article/details/103276106?ops_request_misc=%257B%2522requ原创 2021-12-01 18:12:37 · 3456 阅读 · 0 评论 -
目标检测1
1、目标检测输入图像给出物体类别是 图像分类框出物体是 目标检测将目标切割出来是 实例分割(图像分割2、实际应用场景3、存在的挑战多尺度:目标有近远所以大小不同分别为大样本小样本小样本:小概率发生的事情(如烟火报警器,发生火灾的概率极小,样本少,所以为小样本paddle 里给了一些压缩的方案4、算法的发展5、目标检测传统目标检测将它分成目标检测问题提取特征时有大量候选区域,导致特征重复提取而且计算的参数量过大ROI poorling可以解决重复特征提取的原创 2021-07-19 11:41:36 · 93 阅读 · 0 评论 -
2021-06-24
原创 2021-06-24 12:02:11 · 67 阅读 · 0 评论 -
路径中的‘.‘和‘..‘还有‘./‘和‘../‘都是什么意思
这和linux系统是一样的,. 表示当前目录… 表示当前目录的上一级目录。./表示当前目录下的某个文件或文件夹,视后面跟着的名字而定…/表示当前目录上一级目录的文件或文件夹,视后面跟着的名字而定。例如:文件夹 a下面有 文件夹b c 和文件 d。文件夹b下面有e.php 和文件f。则e中的 . 表示 文件夹b./f 表示b下面的文件f。… 表示a文件夹。…/d 表示a文件夹下的d文件。...原创 2021-06-13 20:04:38 · 2647 阅读 · 2 评论 -
用aistudio平台下载网站数据集
最近在整软件杯,多目标检测,要用的数据集太多了,想尝试用在线下载数据集的方法,不小心解锁到啦!来自网站:https://blog.csdn.net/mathlxj/article/details/106329313代码:import urllibimport shutilannURL = "https://motchallenge.net/data/MOT16/"annZipFile = "MOT16.zip"with urllib.request.urlopen(annURL) as原创 2021-06-08 22:15:37 · 1013 阅读 · 0 评论 -
shape[:2]相关问题
img.shape[:2]取彩色图片的长、宽img.shape[:3]取彩色图片的长、宽、通道img.shape[0]图像的垂直尺寸(高度)img.shape[1]图像的水平尺寸(宽度)img.shape[2]图像的通道数注:矩阵中,[0]表示行数,[1]表示列数...原创 2021-06-06 09:45:15 · 445 阅读 · 0 评论 -
多目标跟踪 | FairMOT:统一检测、重识别的多目标跟踪框架,全新Baseline
论文地址:https://arxiv.org/pdf/2004.01888v2.pdf代码地址:https://github.com/ifzhang/FairMOT这篇工作来自华中科技大学和微软亚洲研究院,从结果来看,这篇工作在主流的多目标跟踪数据集上几乎打败之前所有State-of-the-art算法,但标题却称该算法只是个baseline,而且是simple baseline,再次验证大佬们都是谦虚的。一、背景多目标跟踪 (MOT) 是计算机视觉领域中的重要任务,近年来,目标检测和 Re-ID.转载 2021-06-04 09:06:37 · 452 阅读 · 0 评论 -
fine-turning操作
可以看这个链接凹http://www.voidcn.com/search/vxzfhm原创 2021-06-04 08:53:22 · 186 阅读 · 0 评论 -
目标检测比赛提高mAP的方法
数据预处理分析数据集中标注框的性质主要是分析bbox的area和高宽比的分布,根据area和aspect_ratio来设置anchor generator的参数。另外,当aspect ratio分布比较分散时,可以考虑使用Deform conv分析类别均衡问题统计数据集中各类别实例的比例,如果类别分布不均衡(最多和最少差别几倍以上),可以考虑使用detectron2中的RepeatFactorTrainingSampler。训练集和验证集的分割在一般的比赛中,都会限制每天结果的提交次数,因此使原创 2021-05-30 11:06:11 · 3044 阅读 · 0 评论 -
tqdm介绍及常用方法
Tqdm 是一个快速,可扩展的Python进度条,可以在 Python 长循环中添加一个进度提示信息,用户只需要封装任意的迭代器 tqdm(iterator)。使用pip就可以安装。使用方法一: tqdmtqdm(list)方法可以传入任意一种list,比如数组from tqdm import tqdmfor i in tqdm(range(1000)):#do somethingpass12345或者string的数组for char in tqdm([“a”, “b”, “c原创 2021-05-28 17:28:26 · 762 阅读 · 0 评论 -
JSON格式,REL格式,PYTHON格式
JSON格式分割标注文件表示https://www.cnblogs.com/SkySoot/archive/2012/04/17/2453010.htmlREL格式分割标注文件表示https://www.aiuai.cn/aifarm1306.htmlPYTHON格式分割标注文件表示https://blog.csdn.net/qq_38902844/article/details/106172328...原创 2021-05-28 16:50:43 · 200 阅读 · 0 评论 -
解压命令unzip常用方法汇总(aistudio)
还看到一篇博客写的挺好的:https://www.cnblogs.com/cxhfuujust/p/8193310.html原创 2021-05-27 18:31:10 · 868 阅读 · 1 评论 -
pip与pip3
今天在aistudio跑代码的时候,pip导包进来的时候有错误说backbone和numpy版本不兼容(具体啥样的报错也找不到了叭,因为已经解决了呀),后面查看了一些资料,需要换个numpy版本(版本>1.20,但是backbone需要的版本<1.19.5),使用pip指定下载numpy==1.19.5的时候还是报错说numpy的版本只有>1.20的,后来查阅了一些资料,用pip3成功解决附上pip与pip3区别的博客,写的很详细呀!!!https://blog.csdn.net/we原创 2021-05-18 15:30:32 · 147 阅读 · 0 评论 -
MobileNet系列
MobileNet系列一共有三个版本,由于CNN的计算量过于庞大,不便于优化并部署,提出轻量化的MobileNet。目前的MobileNetV3是轻量化并且效果做好的了,综合了MobileNetV1、2的优点,它综合了以下四个特点:1、MobileNetV1的深度可分离卷积(depthwise separable convolutions)。2、MobileNetV2的具有线性瓶颈的逆残差结构(the inverted residual with linear bottleneck)。3、轻量级的注意原创 2021-05-16 18:54:17 · 791 阅读 · 0 评论 -
aistudio解压zip
最近整软件杯,在aistudio上传数据跑代码,还在上传数据阶段,好像太大的包只能一个一个上传,图片啥的只能上传五个,就很离谱呀百度看了一下可以上传压缩包再解压,按照他提示可以复制解压路径但是跑出来是这样的,再百度一下发现并不是这样的来自https://jingyan.baidu.com/article/c275f6ba714393e33d7567b3.htmlhttps://blog.csdn.net/qq_33124895/article/details/91049055import zi原创 2021-05-02 16:33:32 · 6047 阅读 · 2 评论 -
PP-YOLO
1数据增强:Image Mixup:将两张图片混合为一张AutoAugement:利用预先定义好的图像增强的方法值,会自动的根据方法值选择合适的增强方法,完成图像混合的任务Image Mosaic:图像镶嵌,(PP-YOLO暂时没用到,但用在了YOLOv4里),图像镶嵌取四张图片,以井字格形式把他们镶嵌成一张,实现数据增强。还有很多数据增强的方法。(标红的是PP-YOLO用到的了)...原创 2021-05-06 22:06:07 · 516 阅读 · 0 评论 -
YOLO
看的YOLO相关介绍来自https://aistudio.baidu.com/aistudio/education/preview/667719也有视频讲解https://aistudio.baidu.com/aistudio/education/lessonvideo/689798一:YOLOv1二:YOLOv2(从YOLOv2模型开始,YOLO已经开始使用全卷积模型【conv+batchnorm】理解输入输出是什么,分别代表什么意思就基本理解了网络结构的意思了)1.anchor(锚原创 2021-05-04 18:23:11 · 265 阅读 · 0 评论 -
目标检测(aistudio)
https://aistudio.baidu.com/aistudio/education/group/info/1617YOLO精度不是很高但性价比高,运行速度和精度经过一定的修改可以显著提升YOLO(V1)you only look once 意思是你只需要看一次,也就是数据只传进去一次,就出来检测结果了(这就是但阶段的目标检测)多尺度训练,网络可以对不同尺度图像进行训练,提升网络训练效果...原创 2021-05-02 20:42:27 · 299 阅读 · 0 评论 -
aistudio基本教程
https://blog.csdn.net/weixin_41450123/category_10707833.html?ops_request_misc=&request_id=&biz_id=102&utm_term=aistudio%E5%A6%82%E4%BD%95%E5%8A%A0%E8%BD%BDaistudio%E6%9C%89%E7%9A%84%E6%95%B0%E6%8D%AE%E9%9B%86&utm_medium=distribute.pc_search原创 2021-05-02 18:05:05 · 1498 阅读 · 0 评论 -
深度学习网络的backbone
最近报名了软件杯,准备整paddle框架的题,在看某个代码的时候看到了backbone这个单词,百度一下发现这是个很有意思词backbone,这是在知乎上看到的:原创 2021-04-26 13:24:47 · 215 阅读 · 0 评论 -
Mask-R-CNN(3)利用有效特征层获得建议框
看视频讲解的时候看评论区说有必要了解一下Fast-R-CNN网络,所以看了一下,觉得有个挺好的:https://blog.csdn.net/weixin_44936889/article/details/103788908?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-1&spm=1001.2101.3001.4242Region Proposal Network(RPN层)ROI(Region of Intere原创 2021-04-24 22:14:28 · 440 阅读 · 0 评论 -
Mask-RCNN(2)Resnet101
1.M,对应着图像中的CNN部分,其对输入进来的图片有尺寸要求,需要可以整除2的6次方。在进行特征提取后,利用长宽压缩了两次、三次、四次、五次的特征层来进行特征金字塔结构的构造。ask-RCNN使用Resnet101作为主干特征提取网络2.ResNet101有两个基本的块,分别名为Conv Block和Identity Block,其中Conv Block输入和输出的维度是不一样的,所以不能连续串联,它的作用是改变网络的维度;Identity Block输入维度和输出维度相同,可以串联,用于加深网络的。原创 2021-04-23 21:46:44 · 5790 阅读 · 2 评论 -
Mask-R-CNN实例分割算法(1)
1.目标检测算法:(用一个框框出目标)2.语义分割算法:标出属于猫的像素点————————————————————————————二者区别:Mask-R-CNN实例分割算法可以结合两者优点————————————————————————————3.防止失真和保证语义效果的精确,会在图像边缘加上灰条,同时保证图像边长可以整除2的六次方4.图片传入主干特征提取网络,当输入的图片为1024 X 1024时,我们会获得多个特征公用层,相当于将图片划分成不同的网格,每个网格有不同的相应框,利用R原创 2021-04-21 16:48:06 · 941 阅读 · 0 评论 -
动手学深度学习
1.在某种形式上,机器学习就是做出预测。2.经典统计学习技术中的线性回归和softmax回归可以视为 线性 神经网络。3.权重决定了每个特征对我们预测值的影响。偏置是指当所有特征都取值为0时,预测值应该为多少。如果没有偏置项,我们模型的表达能力将受到限制。4.是输入特征的一个仿射变换(affine transformation)。仿射变换的特点是通过加权和对特征进行线性变换(linear transformation),并通过偏置项来进行平移(translation)。开始寻找最好的 模型参数(m原创 2021-04-10 15:57:48 · 500 阅读 · 0 评论 -
动手学深度学习
1.逼近法就是 积分(integral calculus)的起源2.微分多元函数有很多规则,但在深度学习中很多多元函数是复合的,不能用规则来微分函数,所以需要用链式法则来微分函数原创 2021-04-06 14:10:37 · 69 阅读 · 0 评论 -
动手学深度学习
1.处理为两个矩阵,3行4列2.两矩阵对应元素相乘称为 哈达玛积指定axis=0(列)来求每一列的和,输入的轴1的维数在输出形状中丢失。原创 2021-04-05 21:11:37 · 146 阅读 · 0 评论 -
动手学深度学习
2.2数据预处理1.在Python中常用的数据分析工具中,通常使用 pandas 软件包。2.像庞大的 Python 生态系统中的许多其他扩展包一样,pandas 可以与张量兼容。因此,我们将简要介绍使用 pandas 预处理原始数据并将原始数据转换为张量格式的步骤。2.2.1. 读取数据集¶处理缺失值还会把他们给细分出pave和nan类型,是就置为1,否则置为0...原创 2021-04-05 20:44:00 · 199 阅读 · 0 评论 -
动手学深度学习
1.autograd包会自动为我们计算微分2.深度学习是关于优化的2.1数据操作1.n 维数组,也称为 张量(tensor)。2.张量类(在 MXNet 中为 ndarray,在 PyTorch 和TensorFlow中为 Tensor)与 Numpy 的 ndarray 类似,但都比Numpy 的 ndarray多一些重要功能。首先,GPU 很好地支持加速计算,而 NumPy 仅支持 CPU 计算。其次,张量类支持自动微分。这些功能使得张量类更适合深度学习。3.张量表示一个数值组成的数组,这个数原创 2021-04-05 20:31:26 · 289 阅读 · 0 评论 -
动手学习深度学习(符号)
最近在学习深度学习的书,这是《动手学习深度学习》书籍的符号表示原创 2021-04-05 18:08:51 · 173 阅读 · 0 评论