深度学习
文章平均质量分 88
sunny_develop
这个作者很懒,什么都没留下…
展开
-
Fcos目标检测算法简读
应用fcos进行检测很好的解决了小目标检测不到的问题。Fcos的创新点一个是anchor free,另一个是center-ness。 FCOS的模型的主体和RetinaNet基本一样,包括Backbone、Neck以及Head的一部分。下图为Fco原创 2022-06-13 12:15:40 · 839 阅读 · 1 评论 -
RA-CNN论文简读
《Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition》该算法主要分为定位区域和从区域中提取特征两步,对于区域选择在过去的算法中有应用人工手动定义或者通过非监督学习获取特征,但这两种方法都不是机器分类的最优的特征。其次对于人工选择的很小的特征训练时很难训练。基于这个原因作者提出了RA-CNN算法,RA-CNN算法能够在多尺度的图像中定位感原创 2021-01-13 15:38:52 · 754 阅读 · 0 评论 -
《BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed visual Recognition》简读
本文作者为了解决数据长尾的问题,作者提出了BBN模型,该模型分成两个分支,一个是传统的学习分支,另一个是数据再平衡分支。这两个分支利用参数进行平衡,是根据训练的epochs的数量进行调整,它自适应调整整个模型,让模型首先关注传统的学习分支,之后逐渐关注数据再平衡分支。数据平衡的策略:再采样方法:该方法是数据平衡中的主要方式,可以分为两类:1.对于拥有大部分数据的类别进行降采样;2.对拥有小部分数据的类别进行过采样。 权重再调整:该方法是另一个数据平衡的重要方法,它的策略是分配大的权重给小的类别在损原创 2020-11-16 14:01:44 · 883 阅读 · 1 评论 -
YOLOV1_《You Only Look Once: Unfied,Real-Time Object Detection》论文概读
YOLO概述 YoLo与传统检测算法相比较有以下几个优点: YoLo运行特别快; YoLo是对整幅图像进行预测的,背景错误比较少; YoLo可以学到目标的广义特征,泛化性比较强;具体的实现过程 把输入图像分为s*s个grids,如果一个目标的中心在一个grid单元中,这个grid单元就表示识别该目标。每个grid预测B个目标框和每个目标框的confidence,confidence代表了所预测的box含有object的置信度和这个box预测的多准两重信息。...原创 2020-10-15 14:57:22 · 382 阅读 · 0 评论 -
图像质量评估 《Assessing Image Quality Issues for Real-world Problems》
本文作者对盲人拍摄的图片进行质量分类,分为模糊、过亮、过暗、遮挡和旋转等类别,根据图片中的物体是否可以识别分为可识别的和不可识别的,最后对图片进行了信息描述。 目前关于图像质量评估的数据集包括LIVE、LIVE MD、TID2008、TID2013、CSIQ、Waterloo Exploration、ESPL-LIVE等,图像质量评估算法NR-IQA方向包括BRISQUE、NIQE、CNN-NRIQA、DNN-NRIQA和NIMA等。在图像数据创建过程中需要对不可识别的图片进行删除,而能...原创 2020-09-17 15:03:54 · 1377 阅读 · 0 评论 -
EfficientNet 《EfficientNet:Rethinking model scaling for convolutional neural networks》
作者想要达到算法准确度和效率的双重提升,一般提高准确度的方法主要是增加模型的深度或宽度,或者增加图像输入的分辨率。 在准确率方面,自从2012年AlexNet赢得了ImageNet的冠军,卷积神经网络变得越来越流行并且越来越大,2014年冠军GoogleNet有6.8M的参数,2017年的SENet有145M的参数,最新的GPipe有557M的参数量,GPipe这么 大的网络很难在普通的服务器上进行训练,所以也很难普及应用。 在计算效率方面,普遍采用模型压缩的方式,能够在移动设备端进...原创 2020-09-08 16:01:42 · 780 阅读 · 0 评论 -
Deeplabv1 《Semanatic image segmentation with deep convolutional nets and fully connectd CRFS》
作者阐述了在DCNNs应用于图像任务时有两个技术难点需要攻克,一个是信号的降采样,另一个是空间不敏感。信号降采样主要是因为在计算过程中不断的pooling和downsampling,本文应用空洞卷积来解决。空间不敏感是由于在分类任务需要空间固定,所以限制了DCNNs模型的准确性。为解决这个问题作者采用了全连接的条件随机场,全连接CRF计算效率高,并且能够获得边缘细节信息。Atrous Algorithm 空洞策略的已经在小波变换中有广泛的应用,这种方法允许我们用任意的比率值来计...原创 2020-08-31 16:57:21 · 266 阅读 · 0 评论 -
Fixing the train-test resolution discrepancy 文章解读总结
《Fixing the train-test resolution discrepancy》是最近在Imagenet上分类最好的算法模型,文章主要是针对训练的策略和预处理方式进行了改进。 具体的实现方法是用小分辨率的图片训练模型,之后用稍大的分辨率的图片微调模型。 图像分类的预处理,首先对图片进行裁剪,裁剪后对图片Resize后送入模型进行训练,而裁剪不同分辨率的图片块会对模型产生很大的影响,在训练和微调时作者采用不同的处理方式,训练阶段作者采用RandomResizedCro...原创 2020-08-13 19:21:39 · 1121 阅读 · 0 评论 -
Lime 代码
import limefrom lime import lime_imageexplainer = lime_image.LimeImageExplainer()explanation = explainer.explain_instance(image, classifier_fn, labels=(1,), hide_color=None, top_labels=5, num_features=.原创 2020-06-06 20:02:57 · 1852 阅读 · 3 评论 -
好玩的Deep Dream
参照《21个项目玩转深度学习》第4章实现的,Deep Dream是google公司在2015年公布的一项有趣技术,通过读取训练模型中某一层的结果值,添加噪声而得到一张结果图,deep Dream可以很好的帮助我们理解卷积层输出的结果。1.生成原始的Deep Dream图像读取inception模型中名字为“mixed4d_3x3_bottleneck_pre_relu”卷积层的第139通道的结果。import scipyimport tensorflow as tfimport numpy原创 2020-05-09 17:44:41 · 258 阅读 · 0 评论