![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
deep Learning
孟同学
纸上得来终觉浅,绝知此事要躬行
展开
-
Colab 使用中的一些记录
挂载目录!mkdir -p drivefrom google.colab import drivedrive.mount('/content/drive')切换目录import ospath = "/content/drive/MyDrive/AnimeGANv2_pytorch"os.chdir(path)建立软连接,方便目录查找!mkdir -p /data!ln -s /content/drive/MyDrive/dataset /data/datasets...原创 2022-05-23 09:12:00 · 135 阅读 · 0 评论 -
dockerfile中使用miniconda
dockerfile中使用miniconda无conda not foundRUN wget --quiet https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda.sh && \ /bin/bash ~/miniconda.sh -b -p /opt/conda && \ rm ~/miniconda.sh && \原创 2020-12-11 11:31:57 · 3449 阅读 · 0 评论 -
Faster Rcnn中的RPN网络与anchor如何结合生成proposals
首先放出RPN示意图和网络图anchor是RPN的核心:假设我们现在得到的feature map为W * H * C(13 * 13 * 256就是feature map的width=13,height=13,channel=256),我们如何产生网络需要的proposals呢?我们在feature map使用滑动窗口的操作方式(stride=1,padding=1),当前滑窗的中心在原像素空...原创 2019-03-04 20:07:22 · 1340 阅读 · 0 评论 -
LSTM与GRU容易记住的方法
LSTM公式如下,这样写公式更容易理解图如下:GRU公式如下:流程图如下:原创 2019-03-11 20:00:04 · 604 阅读 · 0 评论 -
2019新cv paper
参考文章CVPR2019GA-RPNGA-RPN(Guided Anchoring)是一种新的anchor 生成方法,即通过图像特征来指导anchor 的生成。通过CNN预测 anchor 的位置和形状,生成稀疏而且形状任意的 anchor,并且设计Feature Adaption 模块来修正特征图使之与 anchor精确匹配。GA-RPN相比RPN减少90%的anchor,并且提高9.1%的...原创 2019-03-16 18:00:00 · 1093 阅读 · 0 评论 -
ubuntu无需建立smb服务器即可利用sftp协议打开远程硬盘
打开ubuntu的文件管理系统导航栏有Home, Desktop等,在最下面有Connect to Server,这个既可以连接smb服务器,也可以连接其它协议,自然包括sftp这个神奇的协议。pycharm就是利用该协议进行文件同步的。点击Connect to Serve打开对话框输入Server Address, sftp 协议格式如下:sftp://mengzhibin@192.1...原创 2019-05-09 12:18:48 · 501 阅读 · 0 评论 -
pytorch Load部分weights
我们从网上down下来的模型与我们的模型可能就存在一个层的差异,此时我们就需要重新训练所有的参数是不合理的。因此我们可以加载相同的参数,而忽略不同的参数,代码如下: pretrained_dict = torch.load(“model.pth”) model_dict = et.state_dict() pretrained_dict = {k:...原创 2019-05-09 14:19:59 · 3318 阅读 · 2 评论 -
pytorch loading参数 迁移学习
多gpu训练存储的参数经常会在load的时候由于多了module而错误,因此可以用下面代码去掉 from collections import OrderedDict pretrained_dict = torch.load(pretraind) new_state_dict = OrderedDict() for k, v in...原创 2019-05-20 16:51:23 · 279 阅读 · 0 评论 -
ubuntu cuda install
forbiden nouveau which is the driver of ubuntu’s1.添加conf 文件:cat /etc/modprobe.d/blacklist-nouveau.confblacklist nouveauoptions nouveau modeset=0重新生成 kernel initramfs:sudo update-initramfs -u重启:su...原创 2019-05-12 11:54:39 · 156 阅读 · 0 评论 -
日常笔记
Miniconda3-4.5.4-Linux-x86_64.sh 对应python3.6.5再往后都是Python3.7的版本了原创 2019-06-11 17:20:42 · 1748 阅读 · 0 评论 -
pytorch中语义分割最终的one hot结果转为color image
1.首先我们需要生成一个color list,例如下面所示,表示2个颜色[[255,0,0], [0,255,0]]生成的代码如下,从google的deeplabv3+代码里面找出来的def bit_get(val, idx): """Gets the bit value. Args: val: Input value, int or numpy int ar...原创 2019-06-27 10:25:58 · 2718 阅读 · 3 评论 -
语义分割 Attention模块 CVPR2019
Dual Attention Network for Scene Segmentation该论文提出在spatial和channel维度分别进行attention操作,个人理解attention就是训练出来的Mask,代表每个point的重要性,网络图如下,代码:https://github.com/junfu1115/DANetBiSeNet: Bilateral Segmentation...原创 2019-07-04 18:27:13 · 4623 阅读 · 0 评论 -
CenterNet: Objects as points 算法及作者代码walk through
相信论文的大体意思大家都有看过很多介绍,论文通过预测目标中心点和目标w和h来得到检测框,而且经过测试,该算法的框预测明显优于Yolov3,结果就不贴了。Loss上面是总的Loss ,分别包含Lk中心点heatmap预测loss,Lsize:object size Loss,Loff: 由于下采样导致的离散化错误,因此增加了中心点的offset预测,论文中解释如下:To recover t...原创 2019-07-05 13:44:48 · 3223 阅读 · 4 评论 -
onnx-tensorrt安装时遇到的问题
我使用的docker镜像是 nvcr.io/nvidia/tensorrt 19.03-py3 6053535b43bc下载onnx-tensorrt最新master分支,使用cmake命令如下:cmake -DCUDA_INCLUDE_DIRS=/usr/local/cuda/include -DTENSORRT_ROOT=/opt/tensorrt .. -DGPU_ARCHS="61...原创 2019-07-15 09:15:13 · 1699 阅读 · 0 评论 -
Xavier使用时遇到的一些坑
SDK刷机先按住中间recovery键,然后按开机键,此时屏幕是黑色的,xavier也不怎么发热,此时从SDK宿主机上命令lsusb,查看是否有设备即 nvidia字样.可以从SDK上面filter log,只查看error log, 如果xavier没在recovery mode, 会有相应错误log报出来.Tensorrt 安装现在时间是19年9月2号,所以所说的版本问题,版本对应如下...原创 2019-09-03 10:34:06 · 3815 阅读 · 0 评论 -
Tensorrt使用时遇到的一些坑
数据传输tensorrt并不能消除gpu到cpu的数据传输问题,所以数据拷贝依然比较慢。所以要对传出的数据进行压缩才可以节省时间数据类型pycuda 给的例子支持np.float32比较好,传到kernel以后直接使用float *input即可对内存进行操作。而int 则需要将变量转换为np.int32才能正确的读到...原创 2019-09-08 15:16:42 · 5218 阅读 · 1 评论 -
yolov1
下面引用来自知乎<机器爱学习>YOLO v1深入理解对于yolov1的理解非常清晰① 一张图片最多可以检测出49个对象每个30维向量中只有一组(20个)对象分类的概率,也就只能预测出一个对象。所以输出的 77=49个 30维向量,最多表示出49个对象。② 总共有 492=98 个候选区(bounding box)每个30维向量中有2组bounding box,所以总共是98...原创 2019-03-04 18:09:52 · 298 阅读 · 0 评论 -
vgg resnet inception xception densnet学习笔记
resnet使得网络层数加深,通过shortcut完成梯度回传,减少梯度消失问题inception加宽网络,实现多个feature map的线性组合,实现跨通道的信息整合。原创 2019-03-06 14:20:30 · 400 阅读 · 0 评论 -
Yolo系列架构
TODO1.Yolo架构2.Yolov3相对比yolov2有哪些提升3.Yolov3的优化函数为Adam原创 2019-01-18 11:11:55 · 1503 阅读 · 0 评论 -
优化函数具体细节
TODO对优化函数有较全面的理解原创 2019-01-18 11:13:09 · 238 阅读 · 0 评论 -
Softmax等激活函数特点
TODO如题,softmax,relu等激活函数优劣点为什么softmax很少用在人脸识别上原创 2019-01-18 11:14:07 · 763 阅读 · 0 评论 -
人脸识别insightface中的一些细节
TODOmtcnn速度和架构insightface的网络结构和最后输出的激活函数人脸识别的loss原创 2019-01-18 11:15:23 · 3310 阅读 · 0 评论 -
矩估计
TODO为了学习机器学习的优化函数,准备知识需要看矩估计原创 2019-01-25 11:19:15 · 956 阅读 · 1 评论 -
deeplabv3+ 中crop size参数
deeplabv3+ 中crop size参数deeplabv3+中train.py的输入参数如下:python -u "${WORK_DIR}"/train.py \ --logtostderr \ --num_clones=8 \ --train_split="train" \ --model_variant="xception_65" \ --atrous_rates...原创 2019-01-25 15:07:59 · 6029 阅读 · 5 评论 -
统计2个字符串不同点个数
该代码的背景是统计OCR识别率,按单个文字为统计个数,而不是一张图片为统计个数import difflibdef count_error(text1,text2): text1_lines = text1.splitlines() text2_lines = text2.splitlines() d = difflib.Differ() diff = d.co...原创 2019-01-22 15:25:09 · 328 阅读 · 0 评论 -
pooling池化的作用
作者:谢志宁链接:https://www.zhihu.com/question/36686900/answer/130890492来源:知乎个人觉得主要是两个作用:1.invariance(不变性),这种不变性包括translation(平移),rotation(旋转),scale(尺度)2.保留主要的特征同时减少参数(降维,效果类似PCA)和计算量,防止过拟合,提高模型泛化能力(1)...转载 2019-02-01 13:52:36 · 2706 阅读 · 0 评论 -
ASPP空洞卷积详解
TODOASPP详解deeplabv3+中的应用原创 2019-01-28 17:20:12 · 13841 阅读 · 0 评论 -
卷积神经网络中的add和concatnate区别
使用DenseNet和Inception中更多采用的是concatenate操作,而ResNet更多采用的add操作。concatenate为横向或纵向空间上的叠加,而add为简单的像素叠加。add使用keras中源码容易看到,是像素的叠加def _merge_function(self, inputs): output = inputs[0] for i in rang...原创 2019-02-12 17:58:51 · 5384 阅读 · 0 评论 -
模型压缩deep compression
论文名称Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman coding参考博客:深度神经网络压缩参考视频讲解:深度学习课程中的模型压缩小节手下把论文的方法结构图放置如下:1:剪枝:其中第一步,将模型中作用不大的参数进行去除,例如参数接近0的。...原创 2019-02-23 18:07:48 · 210 阅读 · 0 评论 -
FCN和deeplab系列中用到Output stride,那和input stride有什么区别呢
从stackoverflow中查到如下内容,翻译如下:input stride为我们正常进行卷积时候设置的stride值,output stride为该矩阵经过多次卷积pooling操作后,尺寸缩小的值,例如:input image为224224,经过多次卷积pooling操作后,feature map为77,那么output stride为224/7 = 32.Input stride...原创 2019-02-13 10:51:42 · 5075 阅读 · 0 评论 -
目标检测类算法好的博客
1 faster rcnn: 解读该算法的知乎博客,连接如下:一文读懂Faster RCNN2 mask rcnn:原创 2019-02-24 12:12:47 · 162 阅读 · 0 评论 -
卷积神经网络输出尺寸计算
正常情况:output size = [(n+2p-f)/s]+1n: input size, p:padding, f: filter size, s: stride 有时输入图片无法被stride整除,例如:n = 10, p = 2, f = 3, s =2此时 (10+2-3)/2无法整除,查看博客,发现tensorflow中遇到此情况会padding其中一侧,而不是padd...原创 2019-02-20 20:21:27 · 1718 阅读 · 0 评论 -
RCNN系列笔记
Rcnn总体流程图selected search + alexnet + lstm + l-svm + bounding box regression + nmsselected search合并相邻像素值,合并依据为相似度,度量标准有纹理、梯度、颜色等。当合并到一定比例之后,求每个像素块的最大外接矩形,该矩形即为生成的候选框.Alexnet去掉最后一层1000层的全连接输出,并从im...原创 2019-03-05 20:26:12 · 156 阅读 · 0 评论 -
mAP计算方法和细节
TODO1.recall,precise计算方法2.检测种AP计算方法3.recall以confidence为标准来计算原创 2019-01-18 11:10:17 · 8956 阅读 · 5 评论