白刃的阿白-CSDN博客

原创 C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape

C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape1. 环境与配置MacOS C++环境 onnxruntime1.10.0（brew安装）2.报错情形使用pytorch导出的 .onnx模型文件，其动态轴设定如下： input = torch.randn(1, 3, 736, 736) dynamic_axes = {'images': {2: 'height',

2022-04-12 20:03:24 2494 2

原创 Faster-RCNN特征图可视化

Faster-RCNN特征图可视化pytorch官方的FasterRCNN算法，backbone部分是加了FPN的resnet50，整体是这样的结构。由于特征矩阵实在是看不懂在一层一层的Layer中发生了什么效果，因此将每一层的特征图绘制出来。1. 算法结构大佬画的FasterRCNN算法结构：FasterRCNN四大接口：transformbackbonerpnroi_headsBackbone的输入是张图像，输出是feature map（特征图）。这些特征图会送去后面的RPN（区域

2021-12-09 22:26:03 7173 11

原创 TorchScript学习笔记

TorchScript学习笔记（一）TorchScript是一种可从python代码中创建序列化模型的方法。可以从python代码中保存，并在非python环境中加载模型。注：TorchScript 主要实现的是在 PyTorch 中表示神经网络模型所需的 Python 功能，并不适用于所有的Python特性。torch.jitTorchScript是Pytorch的JIT实现。JIT ，全称是 Just In Time Compilation（即时编译）。JIT 是 Python 和 C++ 的

2021-11-19 21:49:57 2221

原创训练CTPN报错IndexError: list index out of range

训练CTPN报错 IndexError: list index out of range训练CTPN的时候有些图片报这个错。出错代码如下。因为在减均值的时候是三个通道分别减去三个均值，某些图片是两个通道的，长度不匹配所以报错了。解决：转换为RGB三通道图在这 vggMeans = [122.7717, 102.9801, 115.9465] imageList = cv2.split(image.astype(np.float32)) # 分离通道 imageList[0]

2021-11-17 17:16:07 554

原创 ValueError: cannot reshape array of size xx into shape (x,x,x)

ValueError: cannot reshape array of size 571428 into shape (3,351,407)在训练CTPN的时候，数据集处理的 cv2.dnn.blobFromImage 之后的reshape报的这个错。原因是有一张图像它的通道数乘以宽和高等于571428，不等于3 * 351 * 407，因此不能reshape到（3，351，407）。算了一下 571428 = 4 * 351 * 407 ，说明这个图莫名其妙地是个4通道的图像。然后断点找了一下这张图，

2021-11-17 16:56:43 7216

原创 PIL 图片转换为三通道RGB

PIL 图片转换为三通道RGB使用PIL读取一个文件夹中的图片，把它们中不是三通道的图像转换为三通道的RGB图像。并把这些转换过的图像单独保存在/saved中。PS：我的一万张图像后缀名都是.jpg，但其实有一些还是PNG,GIF格式，它们不是三通道的，仅仅更改后缀名是不行的。所以才需要这个转换。from PIL import Imagefrom io import BytesIOimport ospath = "../VOC/JPEGImages/"savepath = "../saved

2021-11-17 16:22:28 6056

原创 Win10编译安装libtorch+torchvision

Win10配置libtorch+torchvision因为要在win10操作系统的C++环境调用pytorch的faster-rcnn模型，只有libtorch貌似不够用，还需要torchvision，而在win10操作系统torchvision只能源码编译安装。以下是我的配置过程即踩坑过程，记录一下。一、libtorch安装libtorch的安装非常简单，因为它是编译好的，下载解压就可以。它有两个版本Release和Debug根据需要自行选择。另外一定注意它需要和pytorch是一个版本的！！！

2021-11-15 10:43:06 2411 4

原创 ICDAR2015数据集转换为VOC

#ICDAR2015数据集转换为VOC

2021-11-14 20:58:34 3830

原创 tf.reduce_mean()

tensorflow tf.reduce_mean()计算张量的某个维度上的元素的平均值。沿着 axis 中给定的维度降低 input_tensor。除非 keepdims 为真，否则对于 axis 中的所有条目求平均值。函数返回降维后的张量。函数定义如下：def reduce_mean(input_tensor, axis=None, keepdims=False, name=None):参数说明：input_tensor是要进行降维的张量。axis:轴。要减少的维度。默认值为None，

2021-06-08 13:56:27 183

转载图像的上采样与下采样

图像的上采样（upsampling）与下采样（subsampled）转载自：链接: https://blog.csdn.net/stf1065716904/article/details/78450997.缩小图像（或称为下采样（subsampled）或降采样（downsampled））的主要目的有两个：1、使得图像符合显示区域的大小；2、生成对应图像的缩略图。放大图像（或称为上采样（upsampling）或图像插值（interpolating））的主要目的是放大原图像,从而可以显示在更高分辨率的显示

2021-05-24 20:36:16 2302

qq_31930361的博客