[pytorch][转载]pytorch-yolov3视频测试代码

最新推荐文章于 2023-02-15 13:37:44 发布

FL1623863129

最新推荐文章于 2023-02-15 13:37:44 发布

阅读量530

点赞数

分类专栏： Pytorch

本文链接：https://blog.csdn.net/FL1623863129/article/details/109889321

版权

Pytorch 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

项目地址：https://github.com/eriklindernoren/PyTorch-YOLOv3

由于作者没有给出视频检测代码。下面测试通过自定义模型视频检测

from __future__ import division

from models import *
from utils.utils import *
from utils.datasets import *

import os
import sys
import time
import datetime
import argparse
import cv2

from PIL import Image

import torch
from torch.utils.data import DataLoader
from torchvision import datasets
from torch.autograd import Variable

import matplotlib.pyplot as plt
import matplotlib.patches as patches
from matplotlib.ticker import NullLocator

def changeBGR2RGB(img):
b = img[:, :, 0].copy()
g = img[:, :, 1].copy()
r = img[:, :, 2].copy()

# RGB > BGR
img[:, :, 0] = r
img[:, :, 1] = g
img[:, :, 2] = b

return img

def changeRGB2BGR(img):
r = img[:, :, 0].copy()
g = img[:, :, 1].copy()
b = img[:, :, 2].copy()

# RGB > BGR
img[:, :, 0] = b
img[:, :, 1] = g
img[:, :, 2] = r

return img

if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("--image_folder", type=str, default="data/samples", help="path to dataset")
parser.add_argument("--vedio_file", type=str, default="/home/fut/test2.asf", help="path to dataset")
parser.add_argument("--model_def", type=str, default="myproj/config/yolov3.cfg", help="path to model definition file")
parser.add_argument("--weights_path", type=str, default="trained-model/yolov3_ckpt_5.pth", help="path to weights file")
parser.add_argument("--class_path", type=str, default="myproj/config/obj.names", help="path to class label file")
parser.add_argument("--conf_thres", type=float, default=0.8, help="object confidence threshold")
parser.add_argument("--nms_thres", type=float, default=0.5, help="iou thresshold for non-maximum suppression")
parser.add_argument("--batch_size", type=int, default=1, help="size of the batches")
parser.add_argument("--n_cpu", type=int, default=3, help="number of cpu threads to use during batch generation")
parser.add_argument("--img_size", type=int, default=416, help="size of each image dimension")
parser.add_argument("--checkpoint_model", type=str, help="path to checkpoint model")
opt = parser.parse_args()
print(opt)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = Darknet(opt.model_def, img_size=opt.img_size).to(device)
if opt.weights_path.endswith(".weights"):
# Load darknet weights
model.load_darknet_weights(opt.weights_path)
else:
# Load checkpoint weights
model.load_state_dict(torch.load(opt.weights_path))
model.eval() # Set in evaluation mode
classes = load_classes(opt.class_path)
Tensor = torch.cuda.FloatTensor if torch.cuda.is_available() else torch.FloatTensor
#if opt.vedio_file.endswith(".mp4"):
cap = cv2.VideoCapture(opt.vedio_file)
colors = np.random.randint(0, 255, size=(len(classes), 3), dtype="uint8")
a=[]
time_begin = time.time()
NUM = cap.get(cv2.CAP_PROP_FRAME_COUNT)
#NUM=0
while cap.isOpened():
ret, img = cap.read()
if ret is False:
break
img = cv2.resize(img, (1280, 960), interpolation=cv2.INTER_CUBIC)

#PILimg = np.array(Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB)))
#imgTensor = transforms.ToTensor()(PILimg)
#基于pytorch的yolov3 从github拉的
# yolov3如何改进成可以对视频进行实时分析
#以下的代码可以在utils的文件里找到是在data loader里面对数据进行处理的，那么也可以把代码直接复制过来用
#需要注意的是 PIL读取的图片是RGB的这里的图片是BGR的是opencv读取的
#进行转换
#转换使用自己写的函数
#前面的都很简单都是从detect的代码复制过来的，加了一个打开视频cap
#然后有很多人的疑问就是代码直接拉过来不知道怎么改，不知道图片怎么改成张量
#但是这个img转化之后缺少一个维度
RGBimg=changeBGR2RGB(img)
imgTensor = transforms.ToTensor()(RGBimg)
imgTensor, _ = pad_to_square(imgTensor, 0)
imgTensor = resize(imgTensor, 416)
#需要用这个unsqueeze去转化
#是看了莫烦的机器学习想到的结合报错信息
imgTensor = imgTensor.unsqueeze(0)
imgTensor = Variable(imgTensor.type(Tensor))
#下面再预测就可以了
#展示一下吧

with torch.no_grad():
detections = model(imgTensor)
detections = non_max_suppression(detections, opt.conf_thres, opt.nms_thres)

a.clear()
if detections is not None:
a.extend(detections)
b=len(a)
if len(a) :
for detections in a:
if detections is not None:
detections = rescale_boxes(detections, opt.img_size, RGBimg.shape[:2])
unique_labels = detections[:, -1].cpu().unique()
n_cls_preds = len(unique_labels)
for x1, y1, x2, y2, conf, cls_conf, cls_pred in detections:
box_w = x2 - x1
box_h = y2 - y1
color = [int(c) for c in colors[int(cls_pred)]]
#print(cls_conf)
img = cv2.rectangle(img, (x1, y1 + box_h), (x2, y1), color, 2)
cv2.putText(img, classes[int(cls_pred)], (x1, y1), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)
cv2.putText(img, str("%.2f" % float(conf)), (x2, y2 - box_h), cv2.FONT_HERSHEY_SIMPLEX, 0.5,
color, 2)

#print()
#print()
#cv2.putText(img,"Hello World!",(400,50),cv2.FONT_HERSHEY_PLAIN,2.0,(0,0,255),2)

cv2.imshow('frame', changeRGB2BGR(RGBimg))
#cv2.waitKey(0)

if cv2.waitKey(25) & 0xFF == ord('q'):
break
time_end = time.time()
time_total = time_end - time_begin
print(NUM // time_total)

cap.release()
cv2.destroyAllWindows()

FL1623863129

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
[pytorch][转载]pytorch-yolov3视频测试代码

项目地址：https://github.com/eriklindernoren/PyTorch-YOLOv3由于作者没有给出视频检测代码。下面测试通过自定义模型视频检测from __future__ import divisionfrom models import *from utils.utils import *from utils.datasets import *import osimport sysimport timeimport datetimeimport ar
复制链接

扫一扫