AI识虫数据集
该数据集提供了2183张图片,其中训练集1693张,验证集245张,测试集245张。
-
size:图片尺寸
-
object:图片中包含的物体,一张图片中包含多个物体
-
name:昆虫名称
-
bndbox:物体真实框
-
difficult:识别是否困难
标注信息读取
1、将昆虫名字转化成数字标签
2、读取annotations目录下的xml文件
3、读取图片和他对应的标注
附:
cv2.imread和cv2.cvtColor
imread 读的彩色图按照BGR像素存储,如果转换成RGB则需要用cvtColor函数进行转换
format函数
用于字符串的格式化
格式化字段将会被 format() 中的参数替换
print("我叫{},今年{}!".format("张三",22)) print("我叫{0},今年{1}!".format("张三",22)) print("我叫{1},今年{0}!".format("张三",22)) # 执行结果 我叫张三,今年22! 我叫张三,今年22! 我叫22,今年张三!
keep_retio
keep_ratio表示是否保持图片原始比例
keep_ratio=True时,通过上面计算方式找到缩放因子
thresh
图像阈值(threshold):图像分割的标尺