![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
雪可问春风
这个作者很懒,什么都没留下…
展开
-
yolov5 FOCUS模块作用
yolov5 focus 模块作用原创 2022-08-18 09:17:15 · 2231 阅读 · 0 评论 -
ffmpeg 裁剪视频 / 批量
使用ffmpeg 裁剪任意视频并输出ffmpeg -i input.mp4 -ss 00:01:00 -to 00:02:00 -c copy output.mp4原创 2022-05-12 14:16:41 · 3615 阅读 · 1 评论 -
图像增强代码
import skimageimport io,osimport matplotlib.pyplot as pltfrom PIL import Image,ImageEnhanceimport cv2import numpy as npimport random#root_path为图像根目录,img_name为图像名字def move(root_path,img_name,off): #平移,平移尺度为off img = Image.open(os.path.join(roo原创 2022-04-21 14:22:08 · 578 阅读 · 0 评论 -
TensorRT 序列化yolov5 模型
1. 从github上git下序列化程序2. 修改gen_wts.py 文件,best.pt是要训练好的yolov5模型,wts是要生成的权重文件。3.修改yololayer.h文件,只需要修改类数即可. cd build cmake .. make -j6 sudo ./yolov5 -s yolov5s.wts yolov5s.engine s最后一个s 表示训练的模型是smlx,注意: yolov5版本要与tensorrt版本一致...原创 2022-03-18 09:55:54 · 1965 阅读 · 0 评论 -
PYTHON OPENCV 获取轮廓精确坐标
效果图和解释看我 c++版本import cv2import numpy as npimport mathimport osdef show(name, img): # 显示图片 cv2.namedWindow(str(name), cv2.WINDOW_NORMAL) cv2.resizeWindow(str(name), 800, 2000) # 改变窗口大小 cv2.imshow(str(name), img)def dis(cx, cy, tx,原创 2022-02-25 17:04:17 · 11556 阅读 · 0 评论 -
yolov5只检测单一类别或者特定的类
在detect.py中170行 if save_img or save_crop or view_img: # Add bbox to image c = int(cls) # integer class # FIXME: if names[int(cls)] == "name_sign":原创 2022-02-24 08:59:05 · 7590 阅读 · 7 评论 -
CUDNN安装及版本选择
CUDNN下载地址选择箭头所指版本进行下载并解压。解压完成后,打开终端cd cudnn-10.2-linux-x64-v8.1.1.33/cuda/ sudo cp include/cudnn.h /usr/local/cuda-10.2/include/ sudo cp lib64/libcudnn* /usr/local/cuda-10.2/lib64/ sudo cp include/cudnn_version.h /usr/local/cuda-10.2/include/ sudo原创 2021-11-23 14:22:36 · 4461 阅读 · 0 评论 -
cv2.waitkey()
一个一秒30帧的视频,想要逐帧检测,需要在waitkey(33)while true: cv2.imshow("11",im0) cv2.waitkey(33)#33毫秒1/33 = 33ms原创 2021-11-12 14:16:14 · 813 阅读 · 0 评论 -
MTCNN论文翻译 人脸检测
Joint Face Detection and Alignment usingMulti-task Cascaded Convolutional Networks多任务级联卷积网络进行人脸检测与对齐Abstract—Face detection and alignment in unconstrained en-vironment are challenging due to various poses, illuminations and occlusions. Recent studies sh原创 2021-10-22 17:38:39 · 930 阅读 · 0 评论 -
ffmpeg 抽帧
ffmpeg -i 2.MOV -vf "select=eq(pict_type\,I)" -vsync vfr -qscale:v 2 -f image2 ./%03d.jpg原创 2021-10-13 14:56:43 · 623 阅读 · 0 评论 -
ubuntu 上传服务器文件提示:Permission denied
ubuntu 使用ssh连接服务进行模型训练时,上传数据集,提示我Permission denied;首先 更改要上传的文件夹权限,777表示所有人都可以修改,读写等操作sudo chmod 777 yolov5_original_code/随后上传sudo scp -r original_yolov5.zip xxxx@192.168.xx.xxx:/home/xxxx/Documents/yolov5_original_code上传完毕后,为了安全起见,再修改文件夹权限为750,即只有原创 2021-08-24 15:57:22 · 2031 阅读 · 0 评论 -
FLIR Thermal Starter 数据集详解 json详解
该数据集提供了带注释的热成像数据集和对应的无注释RGB图像,用于训练和验证神经网络。数据集总共包含14452张红外图像,其中10228张来自多个短视频;4224张来自一个长为144s的视频。所有视频都来自街道和高速路。大多数图片的采样率为1秒两帧,其中视频的帧率为1秒30帧;少数环境中目标较少时,采样率为1秒1帧。train文件夹文件名注释Annotated_thermal_8_bit带标注框的红外图像RGB不带标注框RGB图像thermal_8_bit不带标注框原创 2021-08-16 14:53:12 · 926 阅读 · 0 评论 -
AlexNet 详解+pytorch实现
AlexNet是2012年ILSVRC 2012(ImageNet Large Scale Visual Recognition Challenge)竞赛的冠军网络。由Hinton和他的学生Alex Krizhevsky设计的。论文原文中文版网络结构AlexNet论文中所示的网络结构如下:因为Alex使用在训练模型时使用了两块GPU,所以上下两部分结构是一样的,解读一部分就可以了。AlexNet的特色1.首次使用GPU进行加速训练2.激活函数使用了ReLU函数,而不是Sigmoid函数或者T原创 2021-08-16 09:27:42 · 1514 阅读 · 0 评论 -
LeNet-5 详解+pytorch简洁实现
lenet 是Yann LeCun’s提出用于手写数字识别的简单卷积神经网络, 论文地址网络结构如下:LnNet共7层,不包括输入层,包括两个卷积层、两个池化层、三个全链接层,激活函数用sigmoid()。参数详解如下#1.input层-输入层输入图像统一规划为32*32。2.Convolutions-卷积层-C1层 输入h*w:32*32 in_channels:1 out_channels:6 kernel_size:5*5 padding : none 输出图片h/w:(3原创 2021-08-13 11:30:12 · 1717 阅读 · 0 评论 -
线性 的含义
卷积神经网路中,需要加激活函数,防止线性,线性含义如下:“线性”=“齐次性”+“可加性”,"齐次性"是指类似于: f(ax)=af(x),"可加性"是指类似于: f(x+y)=f(x)+f(y),原创 2021-08-03 09:00:51 · 1226 阅读 · 0 评论 -
PyTorch nn.CrossEntropyLoss() dimension out of range (expected to be in range of [-1, 0], but got 1)
import torchimport torch.nn as nnloss_fn = nn.CrossEntropyLoss()# 方便理解,此处假设batch_size = 1x_input = torch.randn(2, 3) # 预测2个对象,每个对象分别属于三个类别分别的概率# 需要的GT格式为(2)的tensor,其中的值范围必须在0-2(0<value<C-1)之间。x_target = torch.tensor([0, 2]) # 这里给出两个对象所属的类别标签原创 2021-08-02 15:31:57 · 563 阅读 · 0 评论 -
pytorch GPU加速
device = torch.device('cuda:0') #net = MLP().to(device) #把网络模块搬运到GPU上optimizer = optim.SGD(net.paramters(), lr=learning_rate)criteon = nn.CrossEntropyLoss().to(devide) #把loss搬运到GPU上如果你有8张显卡,那么你可以写 cuda:0/1/2/3/4/5/6/7如果大哥真有的话建议大哥给我张用用...原创 2021-07-27 09:14:04 · 127 阅读 · 0 评论 -
logits 在深度学习中的意思
在卷积神经网络中,经过 x经过激活后,没有经过sigmoid或者softmax处理的"东西",如以下forward函数返回值就是logitsw1, b1 = torch.randn(200, 784, requires_grad=True),\ torch.zero(200, requires_grad=True) #ch_out,ch_in 784=28x28w2, b2 = torch.randn(200, 200, requires_grad=True),\原创 2021-07-22 17:30:47 · 1413 阅读 · 0 评论