Online Notes

Inner Peace

排序:
默认
按更新时间
按访问量

Detection-Timeline

Year Month Algorithm Improve Conference 2013 11 R-CNN 将CNN用于Detection CVPR2014 = = = = = 2014 6 SPPNet ...

2018-04-23 15:24:01

阅读数:138

评论数:0

论文阅读: FPN

Introduction 文章开篇即指出,现有的三种 Scale handling 方法都不好。 Featurized image pyramid 计算开销和存储开销都太大: 基于深度网络的检测算法出来之前,检测算法基本都是基于这种scale handling;后来出现的SNIP、SN...

2018-06-12 10:31:07

阅读数:25

评论数:0

深度学习: 选择合适的检测算法

ResNet之前 在ResNet (2015.12) 出来之前,basemodel经历了从AlexNet一家独大,到VGG和GoogleNet平分天下的时期。 ResNet之后 ResNet出来后,由于其简单和强大,成为了basemodel的绝对标杆。 如今从业者一般遵循以下流程: 先...

2018-06-11 14:21:35

阅读数:26

评论数:0

论文阅读: Soft-NMS

Introduction 传统的Non-Maximum Supression去重过程如下: 但是对于两个“高度重合的object”,却容易“误杀”,导致只剩下一个bbox: Innovation 针对传统的NMS计算公式: Bharat Singh等人提出了soft版的NMS...

2018-06-11 10:45:19

阅读数:17

评论数:0

深度学习: 从新视角 综述 Detection算法

前言 该篇blog会持续更新,不断记录我对Detection算法的新总结。 目的性 “去重”&“加重” “去重”的算法 具体阐述 ...

2018-06-10 19:29:41

阅读数:54

评论数:0

论文阅读: DCN

Introduction 传统的CNN中,convolution 和 pooling 的操作已被定死。只能在方正死板的区域内按部就班地映射操作: 这种设计显然对于现实场景中遇到ratio(比例)和rotation(旋转角度)多变的的非刚体object,是不够general的。那么怎么办呢?...

2018-06-10 16:12:48

阅读数:35

评论数:0

机器学习: Metric Learning (度量学习)

[1] Wikipedia-距离函数 [2] DistLearnKit [3] 基于深度学习的Person Re-ID(度量学习) [4] 度量学习 [5] 度量学习(Distance Metric Learning)介绍

2018-06-10 15:07:27

阅读数:60

评论数:0

论文阅读: R-FCN-3000

Introduction Innovation Result Thinking [1] R-FCN-3000 at 30fps: Decoupling Detection and Classification

2018-06-10 11:24:45

阅读数:27

评论数:0

论文阅读: Light-head R-CNN

Introduction Innovation Result Thinking [1] Light-Head R-CNN: In Defense of Two-Stage Object Detector

2018-06-09 17:44:25

阅读数:51

评论数:0

论文阅读: R-FCN

Introduction Innovation Result Thinking [1] R-FCN: Object Detection via Region-based Fully Convolutional Networks [2] [3] [4]

2018-06-09 13:10:43

阅读数:35

评论数:0

论文阅读: Xception

Introduction GoogleNet论文中研究 group size 而搞出了Inceptionv1(即多group的CNN分支)。此后,Inception不断迭代,group size被越玩越复杂,一直发展到了v4版本。 这时,Inception的鼻祖Google团队又提出了 Ext...

2018-06-08 21:10:33

阅读数:28

评论数:0

论文阅读: Cascade R-CNN

Introduction 传统的Faster R-CNN结构如下: 在train阶段,其最终的输出结果是通过如下一个简单的IoU阈值判断来决定哪些proposal作为output: 对IoU阈值设置的探索 由于早前VOC只以 mAP50mAP50mAP_{50} 作为唯一的性能...

2018-06-08 14:33:42

阅读数:35

评论数:0

论文阅读: SNIP

Introduction Innovation Result Thinking [1] An Analysis of Scale Invariance in Object Detection - SNIP

2018-05-20 10:54:20

阅读数:80

评论数:0

论文阅读: Faster R-CNN

Introduction Innovation Result Thinking [1] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

2018-05-19 20:59:23

阅读数:73

评论数:0

论文阅读: Fast R-CNN

Introduction Innovation Result Thinking [1] Fast R-CNN

2018-05-15 20:02:17

阅读数:60

评论数:0

论文阅读: R-CNN

Introduction Innonvation Result Thinking [1] Rich feature hierarchies for accurate object detection and semantic segmentati...

2018-05-15 15:36:31

阅读数:48

评论数:0

硬件: 高性价比的 工作站配置 列表

配置表 配件 型号 单价 数量 汇总 18250 机箱 先马 黑洞 中塔式 280 1 主板 技嘉 Z370 1500 1 CPU 英特尔 i7 8700K 酷睿六核 2800 1 ...

2018-05-13 14:45:10

阅读数:71

评论数:0

如何对网页 长截图

[1] 利用 Chrome 原生工具进行网页长截图 | 一日一技

2018-05-13 14:18:57

阅读数:32

评论数:0

如何把 网页 转换为 PDF

ctrl + b 进入 打印界面: 选择使用预览程序打开PDF: 在左上角的文件一栏选择导出为PDF: 选择存储地址: 点击确定,即可生成PDF文件: [1] 谷歌浏览器Chrome把网页转换成pdf文件...

2018-05-13 14:09:45

阅读数:56

评论数:0

Tmux 使用

Installation macOS下: brew install tmux Usage 快捷键 作用 control + b 进入控制台 % 左右平分出两个窗格 “ 上下平分出两个窗格 x 关闭当前窗格 ...

2018-05-13 13:52:32

阅读数:24

评论数:0

硬件: RFID (射频识别)

Introduction 本节摘自Wikipedia-射频识别: 射频识别(英语:Radio Frequency IDentification,缩写:RFID)是一种无线通信技术,可以通过无线电讯号识别特定目标并读写相关数据,而无需识别系统与特定目标之间建立机械或者光学接触。 无线电的信号是...

2018-05-12 16:55:35

阅读数:48

评论数:0

图像处理: 无损地旋转图像

OpenCV自带的旋转图像方法 (有损) 原图像: 如果用OpenCV自带cv2.warpAffine接口来实现图片旋转: import cv2 # 读取原图像 img = cv2.imread("./girl.jpg") h, w = img....

2018-05-04 13:21:20

阅读数:63

评论数:0

论文阅读: SSD

Introduction SSD是第一个利用到不同scale的feature map进行生成anchor操作的算法。在论文中提到的“default box”,其实就是“anchor”: 既然第一个意识到可以好好开发多层的feature map,那么SSD一下子对各层feature map进...

2018-05-04 08:10:35

阅读数:69

评论数:0

深度学习: CVPR会议

CVPR CVPR: International Conference on Computer Vision and Pattern Recognition。 每年一届,6月份开会。 Paper Searching 进入 CVPR 2018 官网 -> Progr...

2018-04-25 10:25:50

阅读数:201

评论数:0

深度学习: CV顶会 & CV顶刊

CV三大会议 CVPR: International Conference on Computer Vision and Pattern Recognition (每年,6月开会) ICCV: International Conference on Computer Vision (奇数年,1...

2018-04-25 10:13:06

阅读数:223

评论数:0

深度学习: 卷积核 为什么都是 奇数size

卷积核一般都把size设为奇数,主要有以下两个原因: 保证了锚点刚好在中间,方便以模块中心为标准进行滑动卷积。 保证了padding时,图像的两边依然相对称。 [1] 为什么CNN中的卷积核size一般都是奇数...

2018-04-24 18:45:04

阅读数:320

评论数:0

深度学习: global pooling (全局池化)

今天看SPPNet论文时,看到“global pooling”一词,不是很明白是啥概念。上网查了一下定义,在StackOverflow 上找到了答案: 具体回答如下: 说白了,“global pooling”就是pooling的 滑窗size 和整张feature map的size一...

2018-04-24 14:53:19

阅读数:663

评论数:0

论文阅读: SPPNet

Introduction R-CNN中,通过在原图先抠取出很多的像素块,再分别单独进行特征抽取的方式来一个个生成proposal,很低效: SPPNet则改成了直接先对整张图片进行特征抽取。再在这一大张feature map上,接上一个SPP layer: 和R-CNN一样,SPPN...

2018-04-24 10:46:20

阅读数:72

评论数:0

论文阅读: DenseNet

Introduction DenseNet获得 CVPR 2017 Best Paper: 将原本ResNet的 “串行式一对一的identity mapping” 变成了 “一对多的identity mapping”: 不同型号DenseNet的网络结构说明书: Resu...

2018-04-24 09:55:33

阅读数:67

评论数:0

论文阅读: ResNeXt

Introduction ResNeXt是ResNet的加强版,将ResNet原本简单的“plain版残差结构”替换成了“Inception版残差结构”: 每个“Inception版残差结构”内部各通道通过不同权重进行相加: 标准计算公式如下: 作者还给出了不同型号的“Ince...

2018-04-24 09:38:49

阅读数:61

评论数:0

论文阅读: ResNet

Introduction ResNet论文是里程碑级的backbone network,因此获得了 CVPR 2016 Best Paper: 文章受Highway Networks启发,通过在在不相邻的feature map间添加“跨越式”的identity mapping通道,设计出了...

2018-04-24 08:43:05

阅读数:83

评论数:0

python: 读取.xlsx文件

Template XLSX_FIlE = "../../XX.xlsx" NUM_SHEETS = 3 # 获取.xlsx文件的所有sheet列表 workbook = load_workbook(XLSX_FIlE) sheets = workbook...

2018-04-23 20:17:19

阅读数:219

评论数:0

macOS: 安装卷宗失败

首先根据这篇文章去安装好 希捷(for mac)驱动程序:Paragon 。 之后重启mac。 如果插上希捷移动硬盘后,mac右上角还是显示“安装卷宗失败”,则进入系统偏好设置 -> 安全性与隐私: 将这个位置关于禁用Paragon的选项去掉: 之后重新插入希...

2018-04-23 16:34:29

阅读数:957

评论数:0

macOS: 没有移动硬盘的 写权限

Problem Note: 这里以希捷(seagate)硬盘为例。其他牌子移动硬盘写权限的问题可以举一反三。 原本我的mac笔记本是无法往移动硬盘里面写数据的。即右键找不到“粘贴”选项,通过指令cp会显示没有写权限。即使chmod也不行: 经过陈大佬的指点,我登陆希捷官网: 必须...

2018-04-23 16:16:04

阅读数:182

评论数:0

eager evaluation (及早求值) & lazy evaluation (惰性求值)

eager evaluation (及早求值) 及早求值,也被称为贪婪求值(greedy evaluation)或严格求值,是多数传统编程语言的求值策略。 在热情求值中,表达式在它被约束到变量的时候就立即求值。这在简单编程语言中作为低层策略是更有效率的,因为不需要建造和管理表示未求值的表达式的...

2018-04-23 10:33:07

阅读数:46

评论数:0

深度学习: 从YOLOv1到YOLOv3

Introduction 从YOLOv1到YOLOv3,YOLO系独树一帜,自成一派,是检测算法领域的一股清流。 YOLOv1 论文地址:You Only Look Once: Unified, Real-Time Object Detection 是one-stage系检测算法的鼻祖...

2018-04-22 15:48:18

阅读数:244

评论数:0

深度学习: one-stage/two-stage/multi-stage 目标检测算法

Introduction detector主要分为以下两大门派: - one stage系 two stage系 代表性算法 YOLOv1、SSD、YOLOv2、YOLOv3、RetinaNet R-CNN、SPPNet、Fast R-CNN、Faster ...

2018-04-22 15:04:52

阅读数:162

评论数:0

论文阅读: RetinaNet

Introduction 此篇论文获得了ICCV最佳学生论文奖,指导人是FBAI的He Kainming大神: 众所周知,detector主要分为以下两大门派: - one stage系 two stage系 代表性算法 YOLOv1、SSD、YOLOv2...

2018-04-22 14:59:05

阅读数:62

评论数:0

深度学习: ILSVRC竞赛

Large Scale Visual Recognition Challenge (ILSVRC): - ILSVR 全称 ImageNet Large Scale Visual Recognition Competition 举办单位 ImageNe...

2018-04-21 10:15:22

阅读数:280

评论数:0

论文阅读: ShuffleNet

Introduction ShuffleNet是Face++为了产品落地而做的。主要的贡献在于大幅砍削了浮点计算次数。 作者注意到,像Xception、ResNeXt这么好的网络结构,一旦被压缩为小网络,就会性能低下。这也导致了这类先进的网络结构无法被落地到移动设备上。 究其原因,发现是因为...

2018-04-20 21:12:49

阅读数:32

评论数:0

论文阅读: YOLOv3

Introduction 首先,我要贴出大神霸气侧漏的论文Introduction: 这可以解释为“艺高人狂妄”么?(→_→) 该文章继承了YOLOv2的bbox预测任务的方法,对bbox分类任务进行了修改 (用简单的logistic替换下softmax) 。 将DarkNet-1...

2018-04-20 20:27:38

阅读数:145

评论数:0

python: 判断tuple、list、dict是否为空

Test tuple_test = () assert not tuple_test list_test = [] assert not list_test dict_test = {} assert not dict_test Summary 根据实验结果可知,直接通过: ...

2018-04-20 12:11:52

阅读数:41

评论数:0

python: .pkl文件读写

读取 PKL_PATH = '\you\path' string = '' if os.path.isfile(PKL_PATH): # pkl文件内容被一次性读入data import pickle reader = open(PKL_PATH, 'rb') ...

2018-04-20 12:02:55

阅读数:79

评论数:0

论文阅读: YOLOv1

Introduction YOLO是第一个实现one stage detection的里程碑级算法。所谓one stage,即通过一个阶段就简单粗暴地输出cls和detect的骚操作: 它并不需要像two stage那样,先在一个stage生成一堆的候选框,再在一个stage进行双任务(c...

2018-04-20 10:32:25

阅读数:169

评论数:0

ubuntu: 查看cuda版本

nvcc -V

2018-04-19 19:13:12

阅读数:989

评论数:0

深度学习: COCO目标检测测评指标

以下为COCO数据集目标检测的测评指标: 我们看论文时常见的AP50AP50AP^{50}、AP75AP75AP^{75}便是来源于此: 需要注意的是,在COCO数据集评价指标中,所有的AP 默认为mAP 。即,AP50=mAP50AP50=mAP50AP^{50}=mAP^{50},...

2018-04-19 15:28:23

阅读数:349

评论数:0

论文阅读: DetNet

Introduction Face++的Li Zeming大神注意到了现有Detection Network的两大通病: 借用原本为了class而设计的network,牵强地附加上其他辅助结构来实现Detection; 下采样能带来大感受野,从而提升class任务精度。但下采样又会损失空间信...

2018-04-19 14:32:52

阅读数:549

评论数:1

python: .xml文件 操作

.xml 我的.xml文件如下: Code 通过如下代码模板,可实现对.xml文件的信息快捷读取: # 导入库文件 import xml.etree.ElementTree as ET # 指定.xml文件地址 ANNOTATION_PATH = &a...

2018-04-16 21:27:40

阅读数:78

评论数:0

pycharm: 恢复(reset) 误删文件

昨晚写代码的时候,一不小心把某个代码文件误删了。。。赶紧上网找了一下pycharm如何恢复误删文件,结果还真有。 经过操作,成功恢复了误删文件。现将方法过程记录如下: Method 在Project栏中,右键单击需要恢复的文件夹,选择 Local History -> ...

2018-04-16 20:42:26

阅读数:197

评论数:0

python: json库 & .json文件读写

API API Annotation json.dumps( ) 将python中的 字典 转换为 字符串 json.loads( ) 将 字符串 转换为 字典 json.dump( , ) 将数据写入json文件中 json.load...

2018-04-16 20:32:35

阅读数:114

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭