关于KAIST数据集

这篇博客讲述了作者在使用KAIST数据集进行行人检测时遇到的问题,包括如何通过官网获取数据集,以及如何处理数据集中图片后缀错误导致的无法打开问题。解决方案是批量更改图像文件的后缀,并在必要时将PNG转为JPEG。
摘要由CSDN通过智能技术生成

关于KAIST数据集

最近在使用KAIST数据集做行人检测,这个数据集简直各种无奈。
首先需使用谷歌(其他浏览器em..)找到并打开KAIST的官网,然后留下邮箱,他们会发邮件给你,邮件中由下载地址。

下载完,就会发现一个问题——无法打开图像。
Error interpreting jPEG imag file (Not a jPEG file: starts with 0×89 0×50)
这里写图片描述

根据提示并百度后,得知:0*89 0*50 是png。也就是说,这个数据集的图像本来就是png格式,但是后缀却强行改成了jpg,当然打不开。

解决办法就是:将图像的后缀改为png。如果想要使用jpg格式的图像,再将png格式转换为jpg格式。考虑数据量较大,使用python代码批量修改。

将图像的后缀由’jpg’更改为’png‘

import os
img_path="../images/set06/V000/visible"
files = os.listdir(img_path)
for filename in files
 
根据提供的引用内容[1],关于KAIST数据集和YOLO超参数的设置,我找到了一些信息。KAIST数据集是用于行人检测和行人属性分析的数据集,而YOLO是一种用于实时目标检测的算法。 在YOLO中,超参数的设置包括以下几个方面: 1. 网络结构: YOLO算法有不同的版本(如YOLOv1、YOLOv2、YOLOv3等),每个版本的网络结构可能会有所不同。根据引用,YOLOv3采用了Darknet-53网络结构作为主干网络,其中包含53个卷积层。 2. 输入尺寸: YOLO算法中的输入尺寸是一个重要的超参数。根据引用,YOLOv3在KAIST数据集上的实验中,将输入图像的尺寸设置为416x416像素。 3. Anchor boxes: Anchor boxes是用于预测目标边界框的重要参数。根据引用,YOLOv3在KAIST数据集上使用了9个不同尺度和宽高比的anchor boxes。 4. 学习率和迭代次数: 学习率和迭代次数是训练过程中的关键超参数。根据引用,YOLOv3在KAIST数据集上的实验中,将初始学习率设置为0.001,并进行了135个epochs的训练。 5. 其他超参数: YOLO还有其他一些超参数,如损失函数的权重、置信度阈值、非极大值抑制的阈值等。根据引用,YOLOv3在KAIST数据集上的实验中将置信度阈值设置为0.5,并使用了较小的非极大值抑制的阈值(如0.45)以提高检测的召回率。 总结一下,KAIST数据集上的YOLO超参数设置包括网络结构、输入尺寸、Anchor boxes、学习率和迭代次数以及其他超参数的设置。具体的超参数取值可以参考引用中的实验设置。 J. Choi, J. Kwon, and K. M. Lee, "Aerial pedestrian detection using YOLO on Kaist multispectral dataset," 2019 16th IEEE International Conference on Advanced Video and*** 1-6.
评论 32
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值