东吴杯
暂略
介绍
暂略
数据
目前于2021-06-16更新取得
等待赛事方baseline的提出,数据存在一定的噪声,如果使用python读取的话参考的参考如下形式:
官方未标明可以公开,故不放图片和label数据等,提供大致思路。
import json
import cv
filename = "./xxx.json"
with open(filename) as f:
json_data = json.load(f)
for json_dict in json_data:
if(json_dict==KeyValue):
data = json_data[json_dict]
if(......):
label=json_data[json_dict]
"""
read the data just like the width height label and filepath
出于对于噪声问题
"""
// step2 select and remove the noisy data
xy 坐标等问题缺少值
label标签位于shapes下
//step 2 logical method
for key in label:
strname = list(key.keys())
values = list(key.values())
points = values[3]
//增加筛选机制,对noisy进行筛选
label_name = strname[0]
上述逻辑差不多可以完成数据的筛选和构建基础训练集
当然出于Traindata 和Valdata,需自己采用shuffle打乱的方式
//step3 shuffle the data
//可采用Random取值进行分散数据的形式,基础方式
对于数据是否增强和pre-process 等问题,初步查看数据样本,背景较为单一,物体采用旋转的方式对各个角度进行拍摄获得样本。对于目标的xywh的问题,存在大量小目标检测,推荐进行一定的pre-process
//step 4 Data Augmentation
//待定
当然上述逻辑采用个人见解,官方会提供baseline解法,对于想自定义的来说,可作为参考。
当然出于模型和样本,整个样本集,需进行一定的Data Cleaning,并非仅仅存在坐标Noisy现象,也许不排除存在错标等现象。
后续仍会进行更新
baseline模型
2021-06-17 20:00 更新
官方放出baseline模型,从.pth模型文件命名来看,主办方用的baseline:fasterrcnn_resnet50_fpn,那么首先问题先是跑通再是解析baseline或者构建自己的想法数据集,跑通过程全程参考官方数据提供的args。为了走通一遍流程,目前测试良好。
中间逻辑测试输出log产生small bbox直接ignore
目前先测试,今晚23:00查看结果。
2021-06-18
baseline测试,准确率都为0.51左右,第二天嘛,正常,这周过后应该会出现魔改的版本。