图像处理
文章平均质量分 53
Indulge in the deam
这个作者很懒,什么都没留下…
展开
-
如何利用CUDA进行基础编程
CUDA加速原创 2022-10-18 15:07:30 · 392 阅读 · 1 评论 -
神经网络——非线性激活
torch官网:torch.nn — PyTorch 1.11.0 documentation非线性变换的主要目的就是给网中加入一些非线性特征,非线性越多才能训练出符合各种特征的模型。常见的非线性激活:ReLU:官网给出的例子: >>> m = nn.ReLU() >>> input = torch.randn(2) >>> output = m(input)An implementation of CReL..原创 2022-05-22 16:24:57 · 363 阅读 · 0 评论 -
神经网络——最大池化的使用
最大池化的目的在于保留原特征的同时减少神经网络训练的参数,使得训练时间减少。相当于1080p的视频变为了720p网络链接torch.nn — PyTorch 1.11.0 documentation最常用的时MAXPOOL2D最常用的是下采样,其中参数:kernel_size:设置取最大值的窗口,类似于卷积层的卷积核,如果传入参数是一个int型,则生成一个正方形,边长与参数相同;若是两个int型的元组,则生成长方形。stride:步径,与卷积层不同,默认值是kernel_size...原创 2022-05-20 21:41:43 · 963 阅读 · 0 评论 -
卷积层的使用
因为图像是2d的所以选择的是二维卷积常用设置的阐述torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)卷积公式in_channels(int) :输入图像的通道数out_channels(int) :卷积后产生输出的...原创 2022-05-20 15:29:40 · 134 阅读 · 0 评论 -
神经网络卷积操作
官方网址:torch.nn — PyTorch 1.11.0 documentation这里看一下CONV2D 点击CONV2D ,里面有相关的介绍,以及如何使用,在左边的torch.nn.function打开看看其中TORCH.NN.FUNCTIONAL.CONV2D的相关参数是input:输入weight:权重(卷积核)bias:偏置strid:步径(卷积核下一次计算移动的步径)padding:可以通过下面代码实现import torc...原创 2022-05-20 21:46:07 · 867 阅读 · 0 评论 -
神经网络的基本框架——nn.Module的使用
torch.nn 网址torch.nn — PyTorch 1.11.0 documentation其中Containers中包含了6个模块官方提供的模板import torch.nn as nnimport torch.nn.functional as Fclass Model(nn.Module): #继承nn.mudule类 def __init__(self): super().__init__() #调用模板初始化函数 sel原创 2022-05-19 15:56:57 · 708 阅读 · 0 评论 -
dataloader的使用
dataloader:构建可迭代的数据装载器, 我们在训练的时候,每一个for循环,每一次iteration,就是从DataLoader中获取一个batch_size大小的数据的。dataloader官网:torch.utils.data — PyTorch 1.11.0 documentation常用的参数为:dataset: Dataset类, 决定数据从哪读取以及如何读取 bathsize: 批大小 num_works: 是否多进程读取机制 shuffle: 每个epoch是否乱原创 2022-05-18 15:28:02 · 1149 阅读 · 0 评论 -
Torchvision的数据集使用
在pytorch官网中可以下载许多数据集这是Torchvision的数据集Datasets — Torchvision 0.12 documentation下载CIFAR10数据集,root(存储位置):存放在./dataset文件夹中,train(是否为训练集),download(是否下载),train_set=torchvision.datasets.CIFAR10(root="./dataset",train=True,download=True)test_set=torchvis原创 2022-05-17 14:53:53 · 293 阅读 · 0 评论 -
常用的Transforms
call的使用测试代码class Person: def __call__(self, name): print("__cell"+"hello"+name) def hello(self,name): print("hello"+name)person =Person()person("zhangsan")person.hello("lisi")输出结果ToTensor测试代码from PIL import Ima..原创 2022-05-15 20:51:13 · 296 阅读 · 0 评论 -
Transforms的使用
Transforms是常用的图像预处理方法,提高泛化能力。其实是一个py文件其中包含了totensor(将数据类型转换成tensor类型),resize等工具tensor数据类型(通过Transforms.totensor去看两个问题):1、Transforms在python中该如何使用2、为什么我们需要tensor数据类型直接调用Transforms中的totensor就可以了(输入参数可以按ctrl+p查看)tensor_trans=transforms.ToTensor()原创 2022-05-15 15:49:53 · 954 阅读 · 0 评论 -
TensorBoard的使用
TensorBoard是TensorFlow自带的一个强大的可视化工具,也是一个Web应用程序套件。TensorBoard目前支持7种可视化,Scalars,Images,Audio,Graphs,Distributions,Histograms和Embeddings。其中可视化的主要功能如下。(1)Scalars:展示训练过程中的准确率、损失值、权重/偏置的变化情况。(2)Images:展示训练过程中记录的图像。(3)Audio:展示训练过程中记录的音频。(4)Graphs:展示模型的数据原创 2022-05-14 14:58:20 · 1496 阅读 · 0 评论 -
目标检测算法基础知识
BBox:边缘框 一般绿色为人工标注的groud-truth,红色为预测结果xyxy:左上+右下xywh:左上+宽高Anchor:锚框人为设定不同长宽比、面积的先验框 单阶段SSD检测算法中也称Prior boxRoI:特定的感兴趣区域Region Proposal:候选区域/框RPN:Acnhor-based的两阶段提取候选框的网络IoU:评价预测框的质量,IoU越大则预测框与标注越接近(等于两个框交的面积比上两个框并的面积)mAP:衡量模型量化的指标TP是正确的预原创 2022-05-05 21:46:17 · 185 阅读 · 0 评论 -
YOLOv5 神经网络训练(本地训练)
在训练文件train.py中找到main的部分if __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('--weights', type=str, default='yolov5s.pt', help='initial weights path') parser.add_argument('--cfg', type=str, default='', help='mo.原创 2022-05-05 14:18:05 · 1850 阅读 · 0 评论