自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape

C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape1. 环境与配置MacOS C++环境 onnxruntime1.10.0(brew安装)2.报错情形使用pytorch导出的 .onnx模型文件,其动态轴设定如下: input = torch.randn(1, 3, 736, 736) dynamic_axes = {'images': {2: 'height',

2022-04-12 20:03:24 2494 2

原创 Faster-RCNN特征图可视化

Faster-RCNN特征图可视化pytorch官方的FasterRCNN算法,backbone部分是加了FPN的resnet50,整体是这样的结构 。由于特征矩阵实在是看不懂在一层一层的Layer中发生了什么效果,因此将每一层的特征图绘制出来。1. 算法结构大佬画的FasterRCNN算法结构:FasterRCNN四大接口:transformbackbonerpnroi_headsBackbone的输入是张图像,输出是feature map(特征图)。这些特征图会送去后面的RPN(区域

2021-12-09 22:26:03 7173 11

原创 TorchScript学习笔记

TorchScript学习笔记(一)TorchScript是一种可从python代码中创建序列化模型的方法。可以从python代码中保存,并在非python环境中加载模型。注:TorchScript 主要实现的是在 PyTorch 中表示神经网络模型所需的 Python 功能,并不适用于所有的Python特性。torch.jitTorchScript是Pytorch的JIT实现。JIT ,全称是 Just In Time Compilation(即时编译)。JIT 是 Python 和 C++ 的

2021-11-19 21:49:57 2221

原创 训练CTPN报错IndexError: list index out of range

训练CTPN报错 IndexError: list index out of range训练CTPN的时候有些图片报这个错。出错代码如下。因为在减均值的时候是三个通道分别减去三个均值,某些图片是两个通道的,长度不匹配所以报错了。解决:转换为RGB三通道图 在这 vggMeans = [122.7717, 102.9801, 115.9465] imageList = cv2.split(image.astype(np.float32)) # 分离通道 imageList[0]

2021-11-17 17:16:07 554

原创 ValueError: cannot reshape array of size xx into shape (x,x,x)

ValueError: cannot reshape array of size 571428 into shape (3,351,407)在训练CTPN的时候,数据集处理的 cv2.dnn.blobFromImage 之后的reshape报的这个错。原因是有一张图像它的通道数乘以宽和高等于571428,不等于3 * 351 * 407,因此不能reshape到(3,351,407)。算了一下 571428 = 4 * 351 * 407 ,说明这个图莫名其妙地是个4通道的图像。然后断点找了一下这张图,

2021-11-17 16:56:43 7216

原创 PIL 图片转换为三通道RGB

PIL 图片转换为三通道RGB使用PIL读取一个文件夹中的图片,把它们中不是三通道的图像转换为三通道的RGB图像。并把这些转换过的图像单独保存在/saved中。PS:我的一万张图像后缀名都是.jpg,但其实有一些还是PNG,GIF格式,它们不是三通道的,仅仅更改后缀名是不行的。所以才需要这个转换。from PIL import Imagefrom io import BytesIOimport ospath = "../VOC/JPEGImages/"savepath = "../saved

2021-11-17 16:22:28 6056

原创 Win10编译安装libtorch+torchvision

Win10配置libtorch+torchvision因为要在win10操作系统的C++环境调用pytorch的faster-rcnn模型,只有libtorch貌似不够用,还需要torchvision,而在win10操作系统torchvision只能源码编译安装。以下是我的配置过程即踩坑过程,记录一下。一、libtorch安装libtorch的安装非常简单,因为它是编译好的,下载解压就可以。它有两个版本Release和Debug根据需要自行选择。另外一定注意它需要和pytorch是一个版本的!!!

2021-11-15 10:43:06 2411 4

原创 ICDAR2015数据集转换为VOC

#ICDAR2015数据集转换为VOC

2021-11-14 20:58:34 3830

原创 tf.reduce_mean()

tensorflow tf.reduce_mean()计算张量的某个维度上的元素的平均值。 沿着 axis 中给定的维度降低 input_tensor。 除非 keepdims 为真,否则对于 axis 中的所有条目求平均值。函数返回降维后的张量。函数定义如下:def reduce_mean(input_tensor, axis=None, keepdims=False, name=None):参数说明:input_tensor是要进行降维的张量。axis:轴。要减少的维度。默认值为None,

2021-06-08 13:56:27 183

转载 图像的上采样与下采样

图像的上采样(upsampling)与下采样(subsampled)转载自:链接: https://blog.csdn.net/stf1065716904/article/details/78450997.缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个:1、使得图像符合显示区域的大小;2、生成对应图像的缩略图。放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是放大原图像,从而可以显示在更高分辨率的显示

2021-05-24 20:36:16 2302

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除