paddle 进行目标检测_猫狗猴的识别

最新推荐文章于 2024-07-11 20:10:45 发布

Happy丶lazy

最新推荐文章于 2024-07-11 20:10:45 发布

阅读量891

点赞数 2

分类专栏：日常问题项目文章标签：目标检测深度学习人工智能

本文链接：https://blog.csdn.net/qq_39309652/article/details/120996110

版权

日常问题同时被 2 个专栏收录

47 篇文章 3 订阅

订阅专栏

项目

5 篇文章 1 订阅

订阅专栏

最近参加文本分类的比赛，发现自己写的代码和paddle的结果差别还是很大的，我的bert代码一直过拟合，哎，先用paddle吧，毕竟是百度大佬的，如果你想快速做出来一些东西，推荐使用paddle,
这个项目是之前做过猫狗猴的图片分类，现在继续用这个数据集进行目标检测

数据集

制作VOC类型数据集，需要使用 labelImg工具(https://github.com/tzutalin/labelImg),
推荐直接使用
pip install labelImg -i https://mirror.baidu.com/pypi/simple
之后在cmd中labelImg，之后弹出界面
在这里插入图片描述
之后将数据集进行标注，建议先将图片放在一起，因为使用open dir会将所有图片加载进来，你就不用一个一个添加了

按w进行标注

之后进行保存，再按d进行下一张图片标注，直到所有的完成。将所有标注结果放在Annotations文件中，之后再通过代码进行train.txt数据集的创建

import os
import pandas as pd

dir_path = 'image'
imageName_list = os.listdir(dir_path)
imagePath_list = [os.path.join(dir_path, imageName) for imageName in imageName_list]
print(imageName_list)
xml_list = []
for i in imageName_list:
    xml_list.append('Annotations' + '\\' + i.split('.')[0] + '.xml')
txt_list = {'image_url': imagePath_list, 'xml_url': xml_list}

result_df = pd.DataFrame(txt_list)
print(xml_list)
result_df.to_csv('train.txt', sep='\t', header=None, index=0)

在这里插入图片描述

paddle代码

!pip install "paddlex<=1.3.11" -i https://mirror.baidu.com/pypi/simple
# 设置使用0号GPU卡（如无GPU，执行此代码后仍然会使用CPU训练模型）
import matplotlib
matplotlib.use('Agg') 
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
import paddlex as pdx
from paddlex.det import transforms
train_transforms = transforms.Compose([
    transforms.MixupImage(mixup_epoch=250),
    transforms.RandomDistort(),
    transforms.RandomExpand(),
    transforms.RandomCrop(),
    transforms.Resize(target_size=608, interp='RANDOM'),
    transforms.RandomHorizontalFlip(),
    transforms.Normalize(),
])

eval_transforms = transforms.Compose([
    transforms.Resize(target_size=320, interp='CUBIC'),
    transforms.Normalize(),
])
train_dataset = pdx.datasets.VOCDetection(
    data_dir='',
    file_list='train.txt',
    label_list='label_list',
    transforms=train_transforms,
    shuffle=True)
num_classes = len(train_dataset.labels)
model = pdx.det.YOLOv3(num_classes=num_classes, backbone='DarkNet53')
model.train(
    num_epochs=1000,
    train_dataset=train_dataset,
    train_batch_size=2,
    learning_rate=0.001,
    lr_decay_epochs=[200, 400, 600, 800],
    save_interval_epochs=100,
    warmup_steps=100,
    save_dir='output/yolov3_darknet53')
eval_transforms = transforms.Compose([
    transforms.Resize(target_size=608, interp='RANDOM'),
    transforms.Normalize(),
])
import paddlex as pdx
model = pdx.load_model('output/yolov3_darknet53/epoch_100')
image_name = 'image/H_10.jpg'
result = model.predict(image_name,eval_transforms)
pdx.det.visualize(image_name, result, threshold=0.1, save_dir='./output/yolov3_darknet53')