Richard_Che-CSDN博客

原创 Jupyter Notebook多版本共存（Kernel的管理）

背景今天遇到了一个问题：当我加载了某个虚拟环境(virtualenv)后，确认了在bin/activate预先设置的环境变量已经生效，于是打开jupyter notebook：jupyter notebook --port xxx --ip 10.10.xxx.xx但是打开notebook之后通过os.getenv(‘LD_LIBRARY_PATH’)发现上述生效的环境变量在notebook却不见了，从而使得需要import的包中某些动态连接库找不到。原因排查尝试通过os.environ[‘L

2020-10-27 10:30:38 727

原创 Pytorch import mmcv 遇到 which: no hipcc解决办法

现象：1. import torch的时候没有出现这个问题2. improt mmcv的时候产生的，但似乎不影响使用参考：1.https://github.com/open-mmlab/mmcv/issues/2742.https://github.com/pytorch/pytorch/pull/35789/files在python3.6/site-packages/torch/utils/cpp_extension.py 中做如下修改：...

2020-07-26 12:33:37 3340

原创论文笔记：Panoptic-DeepLab: A Simple, Strong, and Fast Baseline for Bottom-Up Panoptic Segmentation

核心思想：一种高效的bottom-up全景分割方法，比two-stage更快一个统一的backbone，分出两个结构非常相似的头部，实现两种任务：一个是one-stage的实例分割，一个是语义分割，最终通过后处理将二者集成起来one-stage实例分割实际上是class-agnostic(类别无关)的offset回归 + 实例中心heatmap这个框架可以用任意的语义分割的代替，具有很强的灵活性Intro全景分割的目的：对每个像素点给予不同的label + instance ID（如果对于

2020-07-11 23:51:16 2568 2

原创论文笔记：ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

中心思想指出当前主流的对轻量级网络的衡量方式不够全面（仅用FLOPs来衡量一个模型的轻量级程度）实际在端上执行一张图像的预测，还需要考虑其他因素，如内存访问，平台架构等等因此从实际角度出发，给出了一些轻量级网络的设计指导，并最终根据这些指导，引出了新的网络结构——ShuffleNet v2用FLOPs衡量模型的主要问题FLOPs本身和实际应用中关心的效率指标未必成正相关，如在应用中一般用的是speed, latency在FLOPs相同的情况下，不同网络的真正速度也有差别，同一个网络，在不

2020-06-11 23:12:47 390

原创论文笔记：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

论文链接：https://arxiv.org/abs/1707.01083v2中心思想看到了在形如Xception & ResNext等网络存在大量1x1的卷积，虽然降低了参数量，但使得Latency增加，不够高效使用了point-wise group conv + channel shuffle的操作来减少1x1卷积的计算负担channel shuffle是本文的最大特点，加强了特征图每个channel之间的信息流通设计思路对于Xception, ResNext这些网络，利用了D

2020-06-05 21:28:06 256

原创论文笔记：YOLOv4: Optimal Speed and Accuracy of Object Detection

中心思想：在提出YOLOv4之前，作者先对现有的主流改进思路，进行了分类&综述基于上述的改进思路进行尝试，整合，最终提出了YOLOv4。主要的贡献在于：能够实现低成本的训练（只用1张卡）验证了训练&预测过程中的一些trickBag of FreebiesBag of Freebies指的是通过更好的训练方式来得到性能的提升，而这种训练方式不会对模型的预测(inference)带来比较大的负担最常见的Freebie是数据增广，主要目的是提升训练数据的差异性，常用的数据

2020-06-04 19:26:08 425

原创论文笔记：VarGNet: Variable Group Convolutional Neural Network for Efficient Embedded Computing

中心思想：固定group convolution中每个group的channel个数，而不是遵循现有的做法：固定group的个数各层之间的计算策略由于group channel个数的固定，使得模型在硬件端更容易优化设计满足嵌入式端上网络的几种思路：两个方向设计出算力需求少的网络（减少乘加次数，MAdds），如shufflenet v1/v2, mobilenet v1/v2从FPGA（硬件）、编译器方面入手，优化卷积等操作的计算方式但是上述的两个发展方向，往往是背道而驰的。如果单纯降低MA

2020-06-02 19:05:59 1568

原创论文笔记：YOLOv3: An Incremental Improvement

Yolov3论文链接：https://pjreddie.com/media/files/papers/YOLOv3.pdf中心思想在原有的YOLO基础上加上一系列的细节改进从而使性能得到提升相关改进：bbox的编码（转换）：和YOLOv2采用相同的label坐标encode的方式如下，其中(bx,by,bw,bh)(b_x, b_y, b_w, b_h)(bx,by,bw,bh)分别是bbox的中心点以及宽高。bx=σ(tx)+cxb_x = \sigma(t_x) + c_xb

2020-05-30 18:08:24 276

原创论文笔记：EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

论文：https://arxiv.org/abs/1905.11946中心思想提出了一种同时对深度，宽度，尺度（这里指的是输入的分辨率）的网络扩展(scale)方式以往的工作仅限于在width /height/resolution(input resolution)三者之一进行扩展而同时调节这几个变量又费时费力本文发现3个变量只需要同时乘一个系数就能得到比较好的效果，称为compound scale method，复合网络扩展使用了网络结构搜索的方式，得到EfficientNet作为ba

2020-05-30 12:17:16 407

原创论文笔记：SSD: Single Shot MultiBox Detector

中心思想：直接通过一个神经网络实现目标检测。关键：不对特征进行重采样在不同的尺度&比例的default box下（其实就是Anchor），将BBox的输出空间离散化成每个Feature Map中的点使用了Multi-scale输出，预测时输出的是分数 + 偏移量（adjustment）减少了Two-stage中的Proposal -> ROIPooling -> RCNN这种结构（SSD并非第一个这么做的，前面有YOLO，但是做了一系列的改进）使得模型易于训练，并且能够达到T

2020-05-30 12:13:53 1156

原创论文笔记：Focal Loss for Dense Object

中心思想探究为什么one-stage detection（dense approach）会比two-stage（sparse approach）性能低。查出：根本原因是分类分支中前景&背景的比例严重失衡为了解决这个问题，从Loss入手提出了focal loss，用于调整Loss低（分得比较好的）样本的权重，从而防止Loss高的少量样本被大量Loss低的样本淹没为了验证focal loss的正确性提出了retinanetClass Imbalance Problem:对于Two-sta

2020-05-28 20:51:26 351

原创 Convolution & DepthWise Conv

CNN中的卷积(Convolution)操作详解CNN中的卷积层为了能适配NCHW这样的layout，将卷积的参数也设计成４维矩阵的形式，如下图所示（假设batch size = 1）h,ｗ分别为卷积核的大小，比如（５，５），（３，３）一个卷积核：定义为(1, C, h, w)这样的格式，C为输入特征图的通道数输入特征图经过一个卷积核后变成1*1*H/s*W/s，其中s为卷积的步长(stride) 如果输出通道数为M，则会有M个这样的卷积核（绝大多数情况下这M个卷积核的参数或者说权重都不相

2020-05-23 00:14:02 738

原创 Hinge Loss简介

Hinge Loss简介标准Hinge LossHinge本身是用于分类的Loss，给定Label y=±1y=\pm 1y=±1这个Loss的目的是让预测值y^∈R\hat{y} \in Ry^∈R和yyy相等的时候，返回0，否则返回一个线性值基于2的需求，Hinge Loss的定义：L(y^)=max(0,1−y⋅y^)L(\hat{y}) = max(0, 1-y \cdot \hat{y})L(y^)=max(0,1−y⋅y^)。当yyy和y^\hat{y}y^相等，Loss等于0

2020-05-18 22:01:07 13172 1

原创论文笔记：Rethinking ImageNet Pretraining——是否需要Pretrain

论文：https://arxiv.org/pdf/1811.08883.pdf本文主要：说明能在检测或者实例分割上通过From Scratch的方式得到比较好的效果甚至能大部分复用finetune ImageNet预训练网络时候的超参，仅仅是迭代次数提升，都可以得到接近ft的效果pretrain仅能够加速训练的收敛，不会对目标任务的指标提升起作用这样的结论让人重新审视目前流行的 Pretrain-fintune流程Intro传统思路认为Pretrain学习了图像的一些通用特征，在此基础上

2020-05-17 21:58:19 619

原创论文笔记 CentripetalNet: Pursuing High-quality Keypoint Pairs for Object Detection

论文：https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/2003.09119.pdf代码：https://github.com/KiveeDong/CentripetalNet相关介绍：https://zhuanlan.zhihu.com/p/137539121摘要：本文提出了CentripetalNet ，主要解决的是Anchor Free，Corner Based检测中的Corner匹配问题，主要的贡献包括：通过..

2020-05-16 10:31:54 637

原创论文笔记：Object as Points

论文：https://arxiv.org/pdf/1904.07850.pdf代码：https://github.com/xingyizhou/CenterNet主要贡献：摒弃了One stage 或者 two-stage的基于Anchor对BBox进行回归+分类的操作将BBox为中心点+宽高这样的方式，从而直接将BBox的回归转换成角点的检测同时这个BBox可以包含（编码）更多的信息，比如中心点 + 宽高 + 朝向 + 深度等以点来代替Anchor回归+分类的机制，更高效One-sta

2020-05-16 00:27:04 348

原创论文笔记：Training Region-based Object Detectors with Online Hard Example Mining

论文：https://arxiv.org/pdf/1604.03540.pdf简单来说，本文就是在Fast RCNN的基础上加入了在线难样本挖掘（Online Hard Example Mining, OHEM）。因此笔记也相应包含2部分：Fast RCNN的简单回顾&OHEM的介绍Fast RCNN的回顾Fast RCNN主要包含两个步骤：1. Convolution Network 在全图中通过CNN提取全局特征；2. ROI Network，通过ROI Pooling的方式提取出RO

2020-05-13 22:46:57 240

原创论文笔记：AugFPN: Improving Multi-scale Feature Learning for Object Detection

代码：https://github.com/Gus-Guo/AugFPN论文：https://arxiv.org/abs/1912.05384摘要现有的SOTA检测器都使用了构建特征金字塔（不同尺度的特征组合），来提升对不同尺度（大小）的目标的检测鲁棒性。而FPN是其中的代表性工作本文对FPN进行了分析，找到了其中的一些设计上的缺陷针对缺陷提出了3个改进点，也正是AugFPN的3个组成部分：Consistent Supervision：用于降低不同scale之间的语义GapResidu.

2020-05-13 22:43:38 3745 1

原创论文笔记：Quantizing deep convolutional networks for efficient inference: A whitepaper

地址：https://arxiv.org/abs/1806.08342这篇白皮书统一介绍了当前将网络进行定点化的方法。下面将看到的重点记录下来。为了降低深度神经网络的计算量以及带宽（内存占用量），一种简单可行的方式就是将浮点网络（网络权重都是float类型数值）转换成定点网络（网络权重都是或者部分是int8类型）具体来说，这么做的优势在于：不用改变网络结构，不用重新训练单个int8定点数的内存占用就已经是float32这种浮点数的1/4。显然这样的定点化转换能够降低模型的占用降低运行时所需的带宽

2020-05-13 22:13:38 499

原创 Faster RCNN Review(2)：Label的生成

Label的生成(RPN)RPN部分的Label，是连同数据增广，在送入网络训练之前就已经生成好的。由于检测需要解决的是2个问题：坐标的回归&坐标点的分类，自然地这里的Label包含的是2方面：分类Label的生成&回归Label的生成分类Label的生成（RPN）假设原图大小为 H∗WH*WH∗W，有9个anchor，Feature Map stride为16，那么最终关于...

2020-04-30 00:17:24 675

原创 Faster RCNN Review(1): Anchor的生成

Intro关于Faster RCNN的介绍或者详解，网上已经有相当多的介绍，比如：一文读懂Faster RCNN。接下来结合实现，介绍一些容易让人产生疑惑的重点难点。Anchor的生成在我们日常的讨论中，Anchor一般都两种含义：对GT框宽高值的一种先验估计，比如Faster RCNN中用到的9个anchor，为了避免混淆，我们称之为Base Anchor将Base Anchor应用...

2020-04-30 00:08:34 351

原创 MxNet学习笔记(3):关于Symbol

Symbol与caffe类似，MxNet中定义了符号运算。我对符号运算的理解是：区别于之前介绍的NDArray，通过符号，我们可以定义出一系列的表达式，或者网络。这样定义出来的表达式或网络有点类似于数学中的函数式，比如f(x)=ax+bf(x) = ax + b，这时候，aa,xx,bb,都仅仅是一些符号，本身的值是未确定的。当这些符号被赋予具体的数值时，才能计算出函数式本身的值f(x)f(x)。而

2017-06-25 17:40:02 3386

原创 MxNet学习笔记(2):GPU支持以及其他

GPU的使用在MxNet中，可以通过gpu_device=mx.gpu()来创建GPU的context创建矩阵的时候，可以通过a = mx.nd.ones((100,100))来创建需要执行一个函数的时候，可以通过以下方式在GPU上执行：gpu_device=mx.gpu() # Change this to mx.cpu() in absence of GPUs.def

2017-06-25 09:53:02 5466 4

原创 MxNet 学习笔记(1)：MxNet中的NDArray

NDArray在MxNet中，NDArray是所有数学运算的核心数据结构，与Numpy中的ndarray相似。与numpy相比，MxNet中的NDArray有以下的优点：对平台通用：在CPU GPU下都兼容可以自动地并行化NDArray的创建在Mxnet中，NDArray实质上指的是mx.nd.array，并且有以下几种常用的属性：ndarray.shape: The dimensions

2017-06-24 23:21:42 10595

原创 LeetCode题解(Week 16):3. Longest Substring Without Repeating Characters

原题目：Given a string, find the length of the longest substring without repeating characters. Examples: Given “abcabcbb”, the answer is “abc”, which the length is 3. Given “bbbbb”, the answer is “

2017-06-16 14:39:05 320

原创 LeetCode 题解(Week15):22. Generate Parentheses

原题目Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses. For example, given n = 3, a solution set is: [ “((()))”, “(()())”, “(())()”, “()(

2017-06-11 12:15:38 390

原创 LeetCode 题解(Week 14):468. Validate IP Address

原题目Write a function to check whether an input string is a valid IPv4 address or IPv6 address or neither.IPv4 addresses are canonically represented in dot-decimal notation, which consists of four decima

2017-06-05 15:57:55 368

原创 LeetCode题解（Week 13）:128. Longest Consecutive Sequence

原题目：Given an unsorted array of integers, find the length of the longest consecutive elements sequence.For example, Given [100, 4, 200, 1, 3, 2], The longest consecutive elements sequence is [1, 2, 3,

2017-06-01 08:42:23 215

原创 Caffe学习(1): Caffe Tutorial阅读笔记

Caffe定义网络的基本组成结构：blob,net,layer

2017-05-19 23:09:35 291

原创 LeetCode 题解(Week 12):375. Guess Number Higher or Lower II

原题目：We are playing the Guess Game. The game is as follows:I pick a number from 1 to n. You have to guess which number I picked.Every time you guess wrong, I’ll tell you whether the number I picked is h

2017-05-18 09:46:20 276

原创 LeetCode 题解(Week 11):Word Break

原题目：Given a non-empty string s and a dictionary wordDict containing a list of non-empty words, determine if s can be segmented into a space-separated sequence of one or more dictionary words. You may a

2017-05-14 08:57:58 310

原创 Ubuntu 14.04 64位 CUDA 安装实录

最近要在Ubuntu下重新安装CUDA，遇到的问题一如既往的多，总结一下。我用的是笔记本电脑，ThinkPad T450, GTX 940M的显卡（另外笔记本自带有Intel集成显卡），Ubuntu 14.04 64位系统一开始使用deb的安装方法，这种安装方法会将CUDA以及驱动一并安装。这种安装方法会将deb包中自带的驱动也一并安装。安装完之后，通过prime-select选择显示设备(inte

2017-05-12 00:04:23 291

原创 LeetCode 题解(Week 10): 467. Unique Substrings in Wraparound String

原题目Consider the string s to be the infinite wraparound string of “abcdefghijklmnopqrstuvwxyz”, so s will look like this: “…zabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuv xyzabcd….”.Now we have anoth

2017-05-08 23:01:00 344

原创 LeetCode题解(Week 9):486. Predict the Winner

原题目：Given an array of scores that are non-negative integers. Player 1 picks one of the numbers from either end of the array followed by the player 2 and then player 1 and so on. Each time a player pick

2017-04-29 23:38:35 281

原创 Ubuntu 14.04 64位下Matlab 2015的安装

最近需要用到Ubuntu下的MATLAB，对此进行了安装，于是在这里记录下安装过程。系统 Ubuntu 14.04 64位MATLAB版本Matlab 2015B安装过程： 1. 下载MATLAB 2. 安装 (1) 挂载ISO镜像文件：$ sudo mkdir /media/matlab$ sudo mount -o loop R2015b_glnxa64.iso /media/ma

2017-04-19 21:28:35 779

原创 LeetCode题解(Week 8):403. Frog Jump

原题目A frog is crossing a river. The river is divided into x units and at each unit there may or may not exist a stone. The frog can jump on a stone, but it must not jump into the water.Given a list of s

2017-04-19 10:45:32 449

原创 Ubuntu 14.04 安装Google Chrome

在一些特别的网页版应用，比如有道云笔记的时候，用Ubuntu自带的Firefox浏览器会出现问题，这个时候我们可以通过安装Chrome来解决，方法如下：通过官网下载chrome的deb包通过–force的方式强烈安装：sudo dpkg -i google-chrome-stable_current_amd64.deb --force这个时候还是会报错，但是不用管 3. 通过sudo apt

2017-04-18 11:52:41 712

原创 LeetCode 题解(Week 8): 523. Continuous Subarray Sum

原题目：Given a list of non-negative numbers and a target integer k, write a function to check if the array has a continuous subarray of size at least 2 that sums up to the multiple of k, that is, sums up

2017-04-17 23:18:01 424

原创 Leetcode题解(Week 7):322. Coin Change

原题目You are given coins of different denominations and a total amount of money amount. Write a function to compute the fewest number of coins that you need to make up that amount. If that amount of mone

2017-04-15 22:32:45 302

原创 LeetCode 题解(Week6):300. Longest Increasing Subsequence

原题目Given an unsorted array of integers, find the length of longest increasing subsequence.For example, Given [10, 9, 2, 5, 3, 7, 101, 18], The longest increasing subsequence is [2, 3, 7, 101], theref

2017-04-06 10:11:07 300

空空如也

空空如也