【柑橘叶片病害检测数据集】nc=5 标签names: ['Melanose', 'black spot', 'canker', 'greening', 'healthy']
名称:【‘黑色素','黑点','溃烂','绿色','健康'’】共5588张,,按8:1:1比例划分(train;4470张,val:558张,test:560张标注文件为YOLO适用的txt格式。可以直接用于模型训练。
柑橘叶片病害检测数据集
数据集描述
该数据集是一个专门用于柑橘叶片病害检测的数据集,旨在帮助研究人员和开发者训练和评估基于深度学习的目标检测模型。数据集涵盖了五种常见的柑橘叶片病害类型:黑色素、黑点、溃烂、绿色化(黄龙病)以及健康的叶片。通过高质量的图像和详细的标注信息,该数据集为开发高效且准确的病害检测系统提供了坚实的基础。
数据规模
- 总样本数量:5,588张图片
- 训练集 (train):4,470张图片
- 验证集 (val):558张图片
- 测试集 (test):560张图片
- 标注格式:YOLO格式(txt文件)
- 目标类别:
- 黑色素 (Melanose)
- 黑点 (Black Spot)
- 溃烂 (Canker)
- 绿色化 (Greening, 通常指黄龙病)
- 健康 (Healthy)
图像特性
- 多样化场景:覆盖了不同类型的柑橘叶片病害,在各种环境和背景下的图像情况。
- 高质量手工标注:每张图像都有详细的边界框标注,支持直接用于训练目标检测模型。
- 真实拍摄:所有图像均为实际拍摄的真实场景,增强了模型在实际应用中的鲁棒性。
- 多类别支持:包含五种不同的病害类型,丰富了数据集的多样性。
- 已划分数据集:数据集已经按照8:1:1的比例划分好训练集、验证集和测试集,可以直接使用。
- 无需预处理:数据集已经过处理,可以直接用于训练,无需额外的数据预处理步骤。
应用场景
- 农业监控:自动检测柑橘园中的病害情况,辅助农民及时采取措施防治病害。
- 智能农业:集成到智能农业管理系统中,实现对柑橘生长状况的自动化监测和管理。
- 科研分析:用于研究目标检测算法在特定农业应用场景中的表现,特别是在复杂背景和光照条件下的鲁棒性。
- 病害预警:通过持续监测柑橘园的情况,提前发现潜在病害,减少损失。
- 教育与培训:可用于农业相关的教育和培训项目,帮助学生和从业人员更好地识别和理解柑橘叶片病害。
数据集结构
典型的数据集目录结构如下:
1citrus_leaf_disease_dataset/
2├── train/ # 训练集
3│ ├── images/
4│ │ ├── img_00001.jpg
5│ │ ├── img_00002.jpg
6│ │ └── ...
7│ ├── labels/ # YOLO格式标注
8│ │ ├── img_00001.txt
9│ │ ├── img_00002.txt
10│ │ └── ...
11├── val/ # 验证集
12│ ├── images/
13│ │ ├── img_00001.jpg
14│ │ ├── img_00002.jpg
15│ │ └── ...
16│ ├── labels/
17│ │ ├── img_00001.txt
18│ │ ├── img_00002.txt
19│ │ └── ...
20├── test/ # 测试集
21│ ├── images/
22│ │ ├── img_00001.jpg
23│ │ ├── img_00002.jpg
24│ │ └── ...
25│ ├── labels/
26│ │ ├── img_00001.txt
27│ │ ├── img_00002.txt
28│ │ └── ...
29├── README.txt # 数据说明文件
数据说明
- 检测目标:以YOLO格式进行标注。
- 数据集内容:
- 训练集 (train):4,470张图片(带YOLO标注)。
- 验证集 (val):558张图片(带YOLO标注)。
- 测试集 (test):560张图片(带YOLO标注)。
- 目标标签:共包含5大类(4种病害 + 健康叶片)。
- 数据增广:数据集未做数据增广,用户可以根据需要自行进行数据增广。
- 无需预处理:数据集已经过处理,可以直接用于训练,无需额外的数据预处理步骤。
示例代码
以下是一个使用Python和相关库(如OpenCV、PIL等)来加载和展示数据集的简单示例代码:
1import os
2import cv2
3import numpy as np
4from PIL import Image
5
6# 数据集路径
7dataset_path = 'path/to/citrus_leaf_disease_dataset/'
8
9# 加载图像和边界框标注
10def load_image_and_boxes(image_path, label_path):
11 # 读取图像
12 image = Image.open(image_path).convert('RGB')
13 width, height = image.size
14
15 # 读取并解析YOLO格式标注文件
16 with open(label_path, 'r') as f:
17 lines = f.readlines()
18
19 boxes = []
20 for line in lines:
21 class_id, x_center, y_center, w, h = map(float, line.strip().split())
22 xmin = int((x_center - w / 2) * width)
23 ymin = int((y_center - h / 2) * height)
24 xmax = int((x_center + w / 2) * width)
25 ymax = int((y_center + h / 2) * height)
26 boxes.append([int(class_id), xmin, ymin, xmax, ymax])
27
28 return image, boxes
29
30# 展示图像和边界框
31def show_image_with_boxes(image, boxes, class_names):
32 img = np.array(image)
33 for box in boxes:
34 class_id, xmin, ymin, xmax, ymax = box
35 class_name = class_names[class_id]
36 cv2.rectangle(img, (xmin, ymin), (xmax, ymax), (0, 255, 0), 2)
37 label = f'{class_name}'
38 cv2.putText(img, label, (xmin, ymin - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
39
40 cv2.imshow('Image with Boxes', img)
41 cv2.waitKey(0)
42 cv2.destroyAllWindows()
43
44# 主函数
45if __name__ == "__main__":
46 subset = 'train' # 可以选择 'train', 'val', 或 'test'
47 images_dir = os.path.join(dataset_path, subset, 'images')
48 labels_dir = os.path.join(dataset_path, subset, 'labels')
49
50 # 获取图像列表
51 image_files = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
52
53 # 随机选择一张图像
54 selected_image = np.random.choice(image_files)
55 image_path = os.path.join(images_dir, selected_image)
56 label_path = os.path.join(labels_dir, selected_image.replace('.jpg', '.txt'))
57
58 # 加载图像和边界框
59 class_names = ['Melanose', 'Black Spot', 'Canker', 'Greening', 'Healthy']
60 image, boxes = load_image_and_boxes(image_path, label_path)
61
62 # 展示带有边界框的图像
63 show_image_with_boxes(image, boxes, class_names)
这段代码展示了如何加载图像和其对应的边界框标注文件,并在图像上绘制边界框。您可以根据实际需求进一步扩展和修改这段代码,以适应您的具体应用场景。
示例代码:使用预训练模型进行推理
以下是使用预训练模型进行推理的示例代码。这里我们假设您使用的是基于YOLOv5的模型,但您可以根据需要选择其他支持目标检测的模型。
1import torch
2import cv2
3import numpy as np
4from PIL import Image
5import yolov5 # 请确保已安装yolov5库
6
7# 数据集路径
8dataset_path = 'path/to/citrus_leaf_disease_dataset/'
9
10# 加载预训练模型
11model = yolov5.load('path/to/pretrained/yolov5_weights.pt') # 替换成实际的预训练模型路径
12model.eval()
13
14# 主函数
15if __name__ == "__main__":
16 subset = 'train' # 可以选择 'train', 'val', 或 'test'
17 images_dir = os.path.join(dataset_path, subset, 'images')
18
19 # 获取图像列表
20 image_files = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
21
22 # 随机选择一张图像
23 selected_image = np.random.choice(image_files)
24 image_path = os.path.join(images_dir, selected_image)
25
26 # 读取并预处理图像
27 image = Image.open(image_path).convert('RGB')
28
29 # 使用预训练模型进行推理
30 results = model(image)
31
32 # 处理预测结果
33 boxes = results.xyxy[0].cpu().numpy()
34
35 # 在图像上绘制边界框
36 img = np.array(image)
37 class_names = ['Melanose', 'Black Spot', 'Canker', 'Greening', 'Healthy']
38 for box in boxes:
39 xmin, ymin, xmax, ymax, conf, class_id = box
40 class_name = class_names[int(class_id)]
41 label = f'{class_name} {conf:.2f}'
42 cv2.rectangle(img, (int(xmin), int(ymin)), (int(xmax), int(ymax)), (0, 255, 0), 2)
43 cv2.putText(img, label, (int(xmin), int(ymin) - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
44
45 # 显示结果
46 cv2.imshow('Image with Boxes', img)
47 cv2.waitKey(0)
48 cv2.destroyAllWindows()
这段代码展示了如何使用预训练的YOLOv5模型进行推理,并显示和保存推理结果。您可以根据实际需求进一步扩展和修改这段代码,以适应您的具体应用场景。如果您需要使用其他模型进行更高级的功能,如模型微调或增量训练,可以参考相应模型的官方文档来进行相应的配置和操作。
改进方向
如果您已经使用YOLOv3、YOLOv5等模型对该数据集进行了训练,并且认为还有改进空间,以下是一些可能的改进方向:
-
数据增强:
- 进一步增加数据增强策略,例如旋转、翻转、缩放、颜色抖动等,以提高模型的泛化能力。
- 使用混合增强技术,如MixUp、CutMix等,以增加数据多样性。
-
模型优化:
- 调整模型超参数,例如学习率、批量大小、优化器等,以找到最佳配置。
- 尝试使用不同的骨干网络(Backbone),例如EfficientNet、ResNet等,以提高特征提取能力。
- 引入注意力机制,如SENet、CBAM等,以增强模型对关键区域的关注。
-
损失函数:
- 尝试使用不同的损失函数,例如Focal Loss、IoU Loss等,以改善模型的收敛性能。
- 结合多种损失函数,例如分类损失和回归损失的组合,以平衡不同类型的任务。
-
后处理:
- 使用非极大值抑制(NMS)的改进版本,如Soft-NMS、DIoU-NMS等,以提高检测结果的质量。
- 引入边界框回归的改进方法,如GIoU、CIoU等,以提高定位精度。
-
迁移学习:
- 使用预训练模型进行微调,利用大规模数据集(如COCO、ImageNet)上的预训练权重,加快收敛速度并提高性能。
-
集成学习:
- 使用多个模型进行集成学习,通过投票或加权平均的方式提高最终的检测效果。
通过上述方法,可以进一步提升模型在柑橘叶片病害检测任务上的性能。如果您需要具体的代码示例或更详细的指导,请告诉我,我可以为您提供更多的帮助。