passion-ma-CSDN博客

原创图像分类数据的文件路径预处理知识点

使用 glob("*/*.jpg") 方法在这个 "images" 目录及其所有子目录下查找匹配模式 "*/*.jpg" 的所有文件。在Python中，这段代码的作用是按照字典序对位于 "images" 目录及其所有子目录中的所有 .jpg 图像文件进行排序并存储它们的路径。最终，image_paths 变量将保存一个按名称排序后的 Path 对象列表，每个对象都代表一个 ".jpg" 图像文件的完整路径。这段代码会首先获取image.jpg所在的父目录的路径，然后从这个父目录路径中提取出父目录的名字。

2024-01-05 15:47:53 452

原创购物小票识别知识点总结

在Python中，re.findall(pattern, string) 函数是 re（正则表达式）模块中的一个函数，用于在字符串中查找所有与正则表达式模式匹配的非重叠匹配项，并返回一个包含这些匹配项的列表。4.根据小票的格式进行识别模型的创建，将小票上的每一种商品的“货号”、“商品名称”、“数量”、“价格”都识别出来，最终形成每条信息对应一种商品的形式。组成，如果字符串中的所有字符都是数字，返回True，否则返回False。1.首先通过AI识别，将购物小票上的商品进行识别，之后再进行小票识别。

2023-12-05 10:11:40 1145

原创 minio服务端搭建使用

5、在 minio/目录下，新建一个minio.sh（使用命令 sudo vi minio.sh 新建）并编辑以下内容，然后将以下内容保存到minio.sh。# nohup启动服务指定文件存放路径 /opt/minio/data 还有设置日志文件路径 /opt/minio/logs。2、上传安装包文件到目录(这个可以自由选择)4、创建minio文件存储目录及日志目录。7、启动minio并查看日志。8、查看minio日志文件。3、为minio添加权限。# 启动minio服务。# 查看是否启动成功。

2023-12-04 10:28:57 1286

原创 ocr识别过程中的python知识点总结

一、Python [::-1]的简单理解与用法从结果上来看，[::-1]的作用是对列表进行翻转，比方说：输出：54321可以发现这个东西的用法和reversed函数是相同的，只不过更为简洁：输出：54321那么这个东西的原理是什么呢？一般来说，我们见过一个冒号的情况比较多，用来做列表切片：输出：多一个冒号的话，新冒号后面的数字表什么呢？其实是表步长，比如：输出：[1, 3]

2023-12-02 09:30:42 1023

原创 Pycharm调试Debug

设置好断点，debug运行，然后F8单步调试，遇到想进去的函数F7进去，想出来的时候，shift+F8出来，跳过不想看的地方，直接设置下一个断点，然后F9过去。

2023-05-16 10:34:24 115

原创算法中加log日志，同时输出到控制台和文件中

1.每个函数必须写try...expect.....finally，把log.error()写在。except BaseException as e:之后，该文件名为common_log.py。log.info()可以写在认何处。

2023-05-15 19:47:58 154

原创 pip安装第三方库

pip install 库名 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com。

2023-05-15 15:36:55 84

原创图像拼接算法研究

可下载对应的dll文件，下载链接https://cn.dll-files.com/vcomp100.dll.html，64位系统对应64位，下载后放入C:\Windows\SysWOW64和C:\Windows\System32。将vlfeat-0.9.20/bin/win64下的sift.exe的绝对路径添加到上面，注意.exe后有一个空格。2.下载PVC包，找到PCV-master\PCV\localdescriptors\sift.py文件的18行，这就就可以生成与图片对应的。解决办法：更换版本为。

2023-03-28 11:13:50 605

原创 Win10安装mediapipe的步骤

发生了变动，可能是添加了新的功能**，需要减少或者添加参数**，而我的原因就是由于mediapipe更新之后对于mediapipe.solutions.pose.Pose类的调用需要。我之前想自己安装mediapipe包进行人体检测的学习，但整了好几个月都不行，这次终于让我整好了，我的python版本为python = 3.7.1。注意，不要直接用pip install mediapipe 进行安装，我之前这样安装的，mediapipe安装好了，但是所需要的。经过这两步mediapipe就安装好了。

2023-02-28 14:25:33 5236

原创 ubuntu执行c++程序

Linux系统中使用命令运行C++ 脚本进行编译首先要保证系统中包含编译工具（g++/gcc）和编辑工具（vim、首先先用Gedit（或vim）准备一个简单的C++脚本，或者使用。），C语言和C++对应的编译器分别为gcc，g++。将会生成hello的可执行文件，使用命令行就可以执行。执行成功会输出C++脚本的结果。

2023-02-15 09:59:38 2292

原创 Yolo v5 pytorch模型转onnx用c++进行推理

1 c++推理onnx模型所需要的库则是windows版本的onnxruntime库，推理的过程其实就是把python推理onnx模型的过程用c++实现一遍，，这里说明是nms用的是opencv自带的，没有进行加权，而且是用的cpu推理的。2.3 推理后得到输出的tensor，对输出的tensor进行后处理，主要是进行nms操作，这里的用到的是opencv自带的nms,另外里面用到的是iou，想改进可以考虑giou,ciou等。1 u版的yolov5 4.0 版本，其他版本没有试过。

2023-02-15 09:52:01 2932

原创 Visual Studio 2015配置OpenCV4.5.3(c++版)

1. 控制面板 -->系统 -->高级系统设置 (或者右击此电脑–>属性–> 高级系统设置)，下载后是opencv-4.5.3-vc14_vc15.exe的应用程序，双击后解压，如下图。1. 打开Visual Studio 2015 --> 新建 --> 空项目。2. 环境变量 --> 系统变量中选择Path --> 编辑 -->新建。3. 选择Debug | x64 --> 右击选择属性。2. 打开视图–> 其他窗口 --> 属性管理器。目录，将该路径添加进去 --> 确定(

2023-01-30 10:31:49 796 1

原创 Attention机制的具体计算过程

一个输入，经过embedding+位置编码后得到最终的输入X（512维），最终的输入X与矩阵参数WQ（512*64维）相乘，得到Query；与矩阵参数WK（512*64维）相乘，得到Key；与矩阵参数WV（512*64维）相乘，得到Value。Query-某个词（婴儿）转化后的输入向量-64维Key-整个句子中，每个词转化的某个向量（Key1，Key2，Key3，Key4）-64维Value-整个句子中，每个词转化的某个向量（Value1，Value2，Value3，Value4）-64维。

2023-01-09 09:17:43 2250

转载 NLP中的RNN、Seq2Seq与attention注意力机制

NLP中的RNN、Seq2Seq与attention注意力机制 - 知乎完全图解RNN、RNN变体、Seq2Seq、Attention机制 - 知乎

2022-11-04 16:59:20 90

原创图像超分经典网络ESRGAN精确解析

此外，利用残差缩放和更小的初始化等有用的技术来促进所提出的深度模型的训练。我们还介绍了使用相对论GAN作为鉴别器，它学会判断一个图像是否比另一个图像更真实，引导生成器恢复更详细的纹理。此外，我们利用激活前的特征增强了感知损失，提供了更强的监督，从而恢复更准确的亮度和逼真的纹理。BN层在训练过程中使用批量的均值和方差对特征进行归一化，在测试过程中使用整个训练数据集的估计均值和方差。当训练数据集和测试数据集的统计差异较大时，BN层容易引入不愉快的工件，限制泛化能力。首先，激活的特征是非常稀疏的。

2022-11-03 10:30:42 685

原创图像超分经典网络 SRGAN精确解析

早期超分辨率方法的优化目标都是降低低清图像和高清图像之间的均方误差。降低均方误差，确实让增强图像和原高清图像的相似度更高。但是，图像的相似度指标高并不能代表图像的增强质量就很高。为什么 SRGAN 的增强结果那么清楚呢？这是因为 SRGAN 使用了一套新的优化目标。SRGAN 使用的损失函数既包括了 GAN 误差，也包括了感知误差。这套新的优化目标能够让网络生成看起来更清楚的图片，而不仅仅是和原高清图像相似度更高的图片。

2022-11-02 16:52:25 3344

原创常用预训练模型下载地址

【代码】常用预训练模型下载地址。

2022-11-01 17:21:50 4480

原创升级Python3.6到Python3.7

1、安装Python3.7。2、为了方便使用，建议创建。

2022-10-31 17:47:08 6913 1

原创 CVPR收藏

CVPR2022论文和代码整理

2022-10-19 14:50:29 97

原创 numpy转为图片并保存

【代码】numpy转为图片病保存。

2022-09-28 10:42:14 1112

原创在服务器上安装mediapipe遇到的问题

1.我正在尝试使用命令安装最新版本的Mediapipe。根据页面，最新版本是0.8.10.1，但命令是安装我的版本0.8.3。我曾尝试使用此命令指定版本号，但随后收到以下错误：解决方法：需要安装python 3.7+和x64版本才能安装之后运行程序出现报错2.

2022-09-02 16:05:27 2899

原创修改一个文件夹下的图片名

import ospath ="file = os.listdir(path)I =10000for name in file: os.rename(os.path.join(path, name), os.path.join(path, "{}.png.format(i)))) I += 1

2022-08-12 15:31:32 117

原创 conda新建环境时报错NotWritableError: The current user does not have write permissions

在使用命令新建环境时，遇到错误：也许是安装Anaconda的时候，使用了sudo sh Ana...造成的多余问题。安装Anaconda的时候使用了root权限，所以现在非root用户没有对anaconda3文件夹的读写权限。方案一：方案二：使用方案一对我的问题无效，但是有网友说是可行的。方案二成功地解决了我的问题，可以新建环境了。Solving environment: done.........

2022-08-09 13:55:07 584

原创 ubuntu下使用filezilla上传文件权限问题

usr/local/的文件路径可以根据你的情况调整，比如你想放在/home/yaoming/下。中的ubuntu的时候出现上次出错，错误详情为：命令: put "E:\All。2. 输入普通用户下的密码，进入root账号下。今天在使用filezilla连接。再次尝试上传，上传成功！再次尝试上传，上传成功！...

2022-08-09 13:50:58 901 1

原创 pytorch中tensor转成图片保存

代码】pytorch中tensor转成图片保存。

2022-07-29 15:59:48 1228

原创 pytorch测试的时候为何要加上model.eval()？

很多机器学习的教程都有提到，在使用pytorch进行训练和测试的时候一定要给实例化的model指定eval，那么pytorch测试时为什么要设置model.eval()呢？model.eval()的功能是什么？接下来的这篇文章告诉你。使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval，eval（）时，框架会自动把BN和DropOut固定住，不会取平均，而是用训练好的值，不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大！...

2022-07-29 09:52:46 846

原创 Streamlit 数据科学必备工具

目前，应用程序需求量巨大，开发人员需要一直开发新的库和框架，帮助构建并部署快速上手的仪表板。3.Streamlit—在启动Streamlit应用程序之前，我们必须安装Streamlit库。在终端中执行以下命令，安装streamlit。1.要创建基本的streamlit应用程序，你需要创建一个新的Python文件，文件名任意，例如app.py，然后保存。3.Streamlit学起来很容易，无需要任何Web开发经验，只需对Python有基本的了解，就足以构建数据应用程序。...

2022-07-20 09:58:35 1538

原创 Linux /dev/sda1磁盘满了，清理办法

两种情况比较多1.查看/tmp　所占的内存，不想重启，可以手动清理2./var/log/syslog.1 所占的内存,清空可以使用下面指令删除30天钱的文件sudo find /var/log/ -type f -mtime +30 -exec rm -f {} \;３.清理linux系统垃圾还有以下命令sudo apt-get autoclean 清理旧版本的软件缓存sudo apt-get clean 清理所有软件缓存sudo apt-get autoremove 删除系统不再使用的孤立软件...

2022-07-08 10:24:05 5157 1

原创查看cuda版本

查看cuda版本

2022-07-08 09:25:21 5317

原创 Ubuntu下Vim的常用操作命令——vi编辑器常用命令

使用Linux（Ubuntu）下自带的Vim编辑器对bashrc等配置文本进行修改时，在terminal中敲入：【以下为几个常用命令】i：光标后键入insertI：光标前键入a：新建一行开始键入x：删除光标后的字符ESC：退出编辑状态，进入Vim命令行状态；q：ESC之后，先敲出冒号“：”，再跟上“q”，表示退出；后面再多接一个叹号“!”表示强制退出；wq：ESC之后，先敲出冒号“：”，再跟上“wq”，表示保存并退出；后面再多接一个叹号“!”表示强制保存后退出；...

2022-07-08 09:16:44 3385

转载 ubuntu安装cmake

ubuntu安装cmake

2022-07-07 15:51:31 1103

原创对目录下的图片进行重命名

# 会出现报错，解决方法：首先ctrl+A全选图片，然后重命名全部命名为0import osimg_path = r'F:\\bady_style_data\\final_data\\normal\\'imglist = os.listdir(img_path)i = 0for img in imglist: i += 1 new_name = str(i) + '.jpg' src = os.path.join(os.path.abspath(img_path), .

2022-05-17 10:40:05 132

原创 ResNet源码解读（pytorch）

import torchimport torchvisionimport argparseimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimfrom torchvision import datasets, transforms, modelsimport torch.utils.model_zoo as model_zooimport math__all__ = ['ResNe.

2022-05-16 15:26:01 684

原创 tensor中数据类型的相互转换

Pytorch中的Tensor常用的类型转换函数 tensor数据类型转换在tensor的后面添加: .int()、.float()、.double()等. 同时也可以使用 .to(type) 进行实现。同时也可以使用 type()函数 ,data为Tensor数据类型，data.type()为给出data的类型，如果使用data.type(torch.FloatTensor)则强制转换为torch.FloatTensor类型张量。当你不知道要转换为什么类型时，但需要求...

2022-05-07 10:04:56 5615

原创分割模型的三种优化方式

【

2022-04-24 13:25:40 2507

原创对指定目录下的图片，取图片名（不包含图片的扩展名）、将文件路径和图片名分开、将文件名和图片扩展名分开

import os# 取图片名（不包含图片的扩展名）picPath = '/home/hisense/hiheight/image_input/1.jpg'imgname = picPath.split("/")[-1].split(".")[0]print(imgname) # 1# 将文件路径和图片名分开picPath = '/home/hisense/hiheight/image_input/1.jpg'imgname = os.path.split(picPath)imgnam.

2022-04-22 17:47:14 473

原创【Yolact数据集制作-labelme使用与转coco详解】

labelme2coco的数据处理主要分两部分：1、用labelme标记样本获取json文件；2、json文件转coco数据集两部分源代码跳转：标记：https://github.com/wkentaro/labelme（不在讲述）转coco：https://github.com/wkentaro/labelme/tree/main/examples/instance_segmentationjson转coco数据集进入instance_segmentation文件夹打开咱之前下载的

2022-04-22 10:32:07 545

转载【图像分割综述】Image Segmentation Using Deep Learning: A Survey

【图像分割综述】Image Segmentation Using Deep Learning: A Survey_gkm0120的博客-CSDN博客_图像分割

2022-04-21 16:36:33 192

原创 cv2.drawContours()、cv2.findContours()、cv2.boundingRect(img)函数用法解析

cv2.drawContours()函数的功能是绘制轮廓，输入变量如下：cv2.drawContours(image, contours, contourIdx, color, thickness=None, lineType=None, hierarchy=None, maxLevel=None, offset=None)第一个参数image表示目标图像，第二个参数contours表示输入的轮廓组，每一组轮廓由点vector构成，第三个参数contourIdx指明画第几个轮廓，如果该参数为负值，

2022-04-21 16:09:28 7877 1

原创 Image.fromarray的用法（实现array到image的转换）

一、Image.fromarray的作用：简而言之，就是实现array到image的转换。二、PIL中的Image和numpy中的数组array相互转换：1. PIL image转换成arrayimg = np.asarray(image)需要注意的是，如果出现read-only错误，并不是转换的错误，一般是你读取的图片的时候，默认选择的是"r","rb"模式有关。修正的办法:　手动修改图片的读取状态img.flags.writeable = True # 将数组改为读写

2022-04-20 17:02:00 3499 2

空空如也

空空如也