目录
3.数据预处理
前言
其实是前段时间参加泰迪杯的赛题记录啦。
在农业生产中预防虫害的工作异常重要,传统的监视、检测方法不能适应工业化农业生产对虫害预防工作的需要。本文结合具体的数据特点,主要应用了yolov5算法建立农田害虫图像识别模型,确定害虫具体位置及类别,并对不同种类的害虫进行了数量统计。
一、读取标记数据
1.数据下载
数据是泰迪杯主办方提供的已经标记好的数据,4k画质的图片,总大小8个G
链接:https://pan.baidu.com/s/1fvmNHGrLvflEovjfCjDLOw?pwd=6666
提取码:6666
(如果过期了可以联系我补)
2.数据示例
图片
标签
3.数据预处理
yolov5要求的输入格式是txt,所以要把csv转成txt,
对于标签需要进行编码,比如这里的虫子编号7,228转成1号和13号,否则实测会报错,这是yolov5框架目前的缺陷
对于坐标进行归一化处理
2022泰迪杯自动提取csv表格文件中的数据,保存到符合YOLOv5格式的txt文件中,并修改标签值的代码实现_Flying Bulldog的博客-CSDN博客_csv转yolo
二、数据分析
分析使用的是泰迪杯平台提供的SPSSPRO数据分析平台,功能差不多就是Tableau+Spss,熟悉这两个软件的小伙伴应该懂我意思(笑)
由上图可以看出只有少部分图片中的害虫个数超过10个,大部分图片的害虫个数都是1到2个
由上图可知到标记样本的害虫目标绝大多数分布在图片的中间位置,极少数出现在图片的边缘
由上图和下表可知61%的图片里是没有害虫的,而在这些有标签的图片中只有八种害虫超过了总数的1%,其中八点灰灯蛾数量最多,占9.3%。
害虫名称 |
无 |
八点灰灯蛾 |
褐飞虱属 |