自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 python实现IoU

def GetIoU(A, B): ''' A[0],A[1]左上角坐标 A[2],A[3]右下角坐标 ''' min_x = min(A[0], B[0]) max_x = max(A[2], B[2]) min_y = min(A[1], B[1]) max_y = max(A[3], B[3]) w_A, h_A = A[2]-A[0], A[...

2019-12-30 15:53:40 244

原创 Pytorch中net.eval与net.train

我发现在有些网络中会存在net.eval()与net.train(),但是有一些却没有。查阅了一些说法,现在记录一下。这两个函数只要适用于Dropout与BatchNormalization的网络,会影响到训练过程中这两者的参数net.train() 这个一般出现在训练函数中,也就是出现于def train(): net.train() ...运用net.train()时,训练时每...

2019-08-12 13:40:00 7618 1

原创 卷积神经网络中全连接层、softmax与softmax loss理解

一般一个CNN网络主要包含卷积层,池化层,全连接层,损失层等。卷积层与池化层在本篇中不做多理解,之后有时间再记录一下,本篇着重讲一下全连接层与损失层。——————————————————————————————————————全连接层:W为全连接层的参数,X是全连接层的输入,也就是特征,经上层卷积或者池化层输出。从图中可以看出X是N1的向量,这是怎么得到的呢?这个输入X就是由全连接层前...

2019-05-16 14:14:16 15846 1

原创 caffe solve.prototxt中的一些概念

1.test_iter=n,该参数表示 需要测试迭代的次数n。test_iter* batchsize(测试集的)=测试集的大小2.test_interval=n,该参数表示 训练的时候,每迭代n次就进行一次测试。3.lr_policy,该参数表示 caffe进行深度学习时的学习策略,具体有:base_lr: 0.01lr_policy: "fixed"max_iter: 40000...

2019-05-13 16:07:03 350

原创 python编码问题——“utf-8”与“gbk”

在进行CRNN训练中文字体OCR时,楼主碰到了令人头疼的问题,中英文编码不同。这边文章主要来讲一下“utf-8”与“gbk”的一些问题,有人或许会问不是还有一个unicode吗?看完下面一张图就知道啦。unicode其实是一种在操作过程中存在的字符状态,一般来讲,例如python中的str都是以“unicode”编码,在进行操作时会具化成为“utf-8”与“gbk”,往往是前者居多。如上图...

2019-05-10 18:17:28 6213 2

原创 利用re.findall进行xml文件解析

本文主要用于记录从xml中提取相应的文本,并利用相对坐标进行截图。import cv2import re# xml文件路径xml_path = './b2635430.xml'# 定义相应的patternname_pattern = '<name>[\S]*?</name>'xmin_pattern = '<xmin>[\S]*?</xmi...

2019-05-06 16:26:43 1087

原创 从GitHub上Clone项目

不知道为什么每次博主想要从github上下载项目时网速都很糟糕,并且有几次下载之后会出现不能make的情况(caffe版本)。clone和下载还是有些区别的,所以这篇文章用来记载一下从github上clone项目的方法。博主系统为:ubuntu16.04具体操作步骤为:1.新建一个文件夹用来存放项目;2.进入该文件夹,右击,选择Open Terminal Here,打开命令窗口;3.在...

2019-04-26 14:57:18 2278

原创 使用Opencv结合Numpy截取图片

首先使用opencv读取图片。img = cv2.imread(os.path.join(path, img_name)) # imread后面括号中的为图片的具体地址用opencv读取的图片,可以理解为以numpy数组显示,所以很多操作可以通用。img.shape = (900,1600,3)(900,1600,3)shape的三个参数,分别表示高度(矩阵行数),宽度(矩阵列数...

2019-04-24 14:44:29 1573

原创 Numpy Transpose 函数理解

最近在学深度学习时,碰到许多关于Numpy的知识点,边学边做点笔记,方便记忆。此篇文章用来学习Numpy Transpose函数。————————————————————————————————array = np.arange(0, 24).reshape(2, 4, 3)print(array)得到一个三维矩阵:[[[ 0 1 2] [ 3 4 5] [ 6 7...

2019-04-22 17:15:07 2550 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除