2020年02月_看不见我呀

09月 04月 02月 01月

转载目标检测之九：其他

9.其他方法除去上面所列的技巧外，还有一些做法也值得注意：更好的先验（YOLOv2）：使用聚类方法统计数据中box标注的大小和长宽比，以更好的设置anchor box的生成配置更好的pre-train模型：检测模型的基础网络通常使用ImageNet（通常是ImageNet-1k）上训练好的模型进行初始化，使用更大的数据集（ImageNet-5k）预训练基础网络对精度的提升亦有帮助超...

2020-02-26 23:46:36 159

转载目标检测之八：RoIAlign

8.RoIAlign RoI对齐RoIAlign是Mask R-CNN（[7]）的工作中提出的，针对的问题是RoI在进行Pooling时有不同程度的取整，这影响了实例分割中mask损失的计算。文章采用双线性插值的方法将RoI的表示精细化，并带来了较为明显的性能提升。这一技巧也被后来的一些工作（如light-head R-CNN）沿用。这一部分暂时没有代码解析。https://zhuan...

2020-02-26 23:44:24 764

转载目标检测之七：Soft NMS

https://zhuanlan.zhihu.com/p/1028171807.Soft NMS 软化非极大抑制NMS后处理图示NMS(Non-Maximum Suppression，非极大抑制）是检测模型的标准后处理操作，用于去除重合度（IoU）较高的预测框，只保留预测分数最高的预测框作为检测输出。Soft NMS由[6]提出。在传统的NMS中，跟最高预测分数预测框重合度超出一定...

2020-02-26 23:43:32 1892

转载目标检测之六：OHEM 在线难例挖掘

https://zhuanlan.zhihu.com/p/1028171806.OHEM 在线难例挖掘OHEM(Online Hard negative Example Mining，在线难例挖掘)见于[5]。两阶段检测模型中，提出的RoI Proposal在输入R-CNN子网络前，我们有机会对正负样本（背景类和前景类）的比例进行调整。通常，背景类的RoI Proposal个数要远远多于前...

2020-02-26 23:40:53 2834

转载目标检测之五：随机权值平均（Stochastic Weight Averaging，SWA）---木有看懂

随机权值平均（Stochastic Weight Averaging，SWA）随机权值平均只需快速集合集成的一小部分算力，就可以接近其表现。SWA 可以用在任意架构和数据集上，都会有不错的表现。根据论文中的实验，SWA 可以得到我之前提到过的更宽的极小值。在经典认知下，SWA 不算集成，因为在训练的最终阶段你只得到一个模型，但它的表现超过了快照集成，接近 FGE（多个模型取平均）。左图...

2020-02-26 23:35:45 4472

转载目标检测之四：预测框微调/投票法/模型融合

4.Box Refinement/Voting 预测框微调/投票法/模型融合微调法和投票法由工作[4]提出，前者也被称为Iterative Localization。微调法最初是在SS算法得到的Region Proposal基础上用检测头部进行多次迭代得到一系列box，在ResNet的工作中，作者将输入R-CNN子网络的Region Proposal和R-CNN子网络得到的预测框共同进行N...

2020-02-26 23:33:24 2756

转载目标检测之三：全局语境

3.Global Context 全局语境这一技巧在ResNet的工作[3]中提出，做法是把整张图片作为一个RoI，对其进行RoI Pooling并将得到的feature vector拼接于每个RoI的feature vector上，作为一种辅助信息传入之后的R-CNN子网络。目前，也有把相邻尺度上的RoI互相作为context共同传入的做法。这一部分暂时没有代码解析。https://...

2020-02-26 23:29:07 648

转载目标检测之二：多尺度

https://zhuanlan.zhihu.com/p/102817180Multi-scale Training/Testing 多尺度训练/测试可参考：初识CV：MMDetection中文文档—4.技术细节zhuanlan.zhihu.com输入图片的尺寸对检测模型的性能影响相当明显，事实上，多尺度是提升精度最明显的技巧之一。在基础网络部分常常会生成比原图小数十倍的特征图，...

2020-02-26 23:26:59 4390

转载目标检测之一： anchor ratio

以cascade_rcnn_r50为例：默认参数是anchor_ratio=[0.5, 1.0, 2.0]anchor_ratio默认参数如何去修改这一部分参数呢？这个参数的含义是长边和短边的比例，一般都是成对出现的（乘积为1），比如。详细解析请自行查找anchor机制，本篇重点是对特定的数据集如何去选取anchor_ratio。要想解决这一部分问题，首先要对你训练的数据进...

2020-02-26 23:11:32 1821

转载数据增强：裁剪》 flip 》 erasing（缓解遮挡）

https://zhuanlan.zhihu.com/p/103267422论文阅读】random erasing data augmentationcode论文说明论文为CNN训练提出了一种新的数据增强方法。Random Erasing，在一张图片中随机的选择一个矩形框，在随机的位置上使用随机的值来擦除图片原来的像素。通过该方法能够给图片加入不同程度的遮挡，通过这样的训练数据，可以...

2020-02-25 22:38:22 820

转载 Inside-Outside Net：ion

核心亮点：1.多尺度2.rnn获取全局信息。收录于CVPR20161.Contribution本文主要关注目标检测过程中的上下文信息以及多尺度信息两个方面，提出了Inside-Outside Net:Inside Net: 采用skiping pooling的方式连接不同卷积层输出的feature map，实现多尺度特征的融合Outside Net: 采用IRNN的结构，整合...

2020-02-24 23:45:17 637 1

转载 map的只管理解

不得不提目标检测中衡量检测精度的指标mAP(mean average precision)。简单来讲就是在多个类别的检测中，每一个类别都可以根据recall和precision绘制一条曲线，那么AP就是该曲线下的面积，而mAP是多个类别AP的平均值，这个值介于0到1之间，且越大越好。具有代表性的工作是ResNet、ION和HyperNet。转自：https://blog.csdn.net/...

2020-02-24 22:02:05 627

matplotlib的学习文档

自己学习的matplotlib库的一些代码，其中包含一些关键的注意事项

2018-07-10

　先看看芯片的特性（Features）、应用场合（Applications）以及内部框图。这有助于我们对芯片有一个宏观的了解，此时需要弄清楚该芯片的一些比较特殊的功能，充分利用芯片的特殊功能，对整体电路的设计，将会有极大的好处。比如AD9945可以实现相关双采样（CDS），这可以简化后续信号调理电路，并且抵抗噪声的效果还好。　　重点关注芯片的参数，同时可以参考手册给出的一些参数图（如AD9945的TPC 1，TPC2等），这是俺们是否采用该芯片的重要依据。像AD9945，就可以关注采样率（maximum clock rate）、数据位数（AD converter）、功耗（Power consumption）、可调增益范围（gain range）等。　　选定器件后，研究芯片管脚定义、推荐的PCB layout，这些都是在硬件设计过程中必须掌握的。所有管脚中，要特别留意控制信号引脚或者特殊信号引脚，这是将来用好该芯片的前提。比如AD9945的SHP、SHD、PBLK、CLPOB等。　　认真研读芯片内部寄存器，对寄存器的理解程度，直接决定了你对该芯片的掌握程度。比如AD9945就有4个寄存器：Operation、Control、Clamp Level和VGA gain，对于这些寄存器，必须清楚它们上电后的初始值、所能实现的功能、每个bit所代表的含义这些基本情况。

2013-02-27

stm32启动过程详解

详细解释了32的启动过程如程序清单一，STM32的启动代码一共224行，使用了汇编语言编写，这其中的主要原因下文将会给出交代。现在从第一行开始分析： ? 第1行：定义是否使用外部SRAM，为1则使用，为0则表示不使用。此语行若用C语言表达则等价于： #define DATA_IN_ExtSRAM 0 ? 第2行：定义栈空间大小为0x00000400个字节，即1Kbyte。此语行亦等价于： #define Stack_Size 0x00000400 ? 第3行：伪指令AREA，表示 ? 第4行：开辟一段大小为Stack_Size的内存空间作为栈。 ? 第5行：标号__initial_sp，表示栈空间顶地址。 ? 第6行：定义堆空间大小为0x00000400个字节，也为1Kbyte。 ? 第7行：伪指令AREA，表示 ? 第8行：标号__heap_base，表示堆空间起始地址。 ? 第9行：开辟一段大小为Heap_Size的内存空间作为堆。 ? 第10行：标号__heap_limit，表示堆空间结束地址。 ? 第11行：告诉编译器使用THUMB指令集。 ? 第12行：告诉编译器以8字节对齐。 ? 第13—81行：IMPORT指令，指示后续符号是在外部文件定义的（类似C语言中的全局变量声明），而下文可能会使用到这些符号。 ? 第82行：定义只读数据段，实际上是在CODE区（假设STM32从FLASH启动，则此中断向量表起始地址即为0x8000000）