华为云-东吴杯

东吴杯

暂略

介绍

暂略

数据

目前于2021-06-16更新取得
等待赛事方baseline的提出,数据存在一定的噪声,如果使用python读取的话参考的参考如下形式:
官方未标明可以公开,故不放图片和label数据等,提供大致思路。

import json
import cv
filename = "./xxx.json"
with open(filename) as f:
    json_data = json.load(f)
for json_dict in json_data:
    if(json_dict==KeyValue):
         data = json_data[json_dict]
    if(......):
    	label=json_data[json_dict]
"""
read the data just like the width height  label and filepath 
出于对于噪声问题
""" 
// step2 select and remove the noisy data
xy 坐标等问题缺少值

label标签位于shapes下

//step 2 logical method
for key in label:
	 strname = list(key.keys())
	 values = list(key.values())
	 points = values[3]
	 //增加筛选机制,对noisy进行筛选
	 label_name = strname[0]

上述逻辑差不多可以完成数据的筛选和构建基础训练集
当然出于Traindata 和Valdata,需自己采用shuffle打乱的方式

//step3 shuffle the data
//可采用Random取值进行分散数据的形式,基础方式

对于数据是否增强和pre-process 等问题,初步查看数据样本,背景较为单一,物体采用旋转的方式对各个角度进行拍摄获得样本。对于目标的xywh的问题,存在大量小目标检测,推荐进行一定的pre-process

//step 4 Data Augmentation
//待定

当然上述逻辑采用个人见解,官方会提供baseline解法,对于想自定义的来说,可作为参考。
当然出于模型和样本,整个样本集,需进行一定的Data Cleaning,并非仅仅存在坐标Noisy现象,也许不排除存在错标等现象。
后续仍会进行更新

baseline模型

2021-06-17 20:00 更新
官方放出baseline模型,从.pth模型文件命名来看,主办方用的baseline:fasterrcnn_resnet50_fpn,那么首先问题先是跑通再是解析baseline或者构建自己的想法数据集,跑通过程全程参考官方数据提供的args。为了走通一遍流程,目前测试良好。
在这里插入图片描述
中间逻辑测试输出log产生small bbox直接ignore
目前先测试,今晚23:00查看结果。
2021-06-18
baseline测试,准确率都为0.51左右,第二天嘛,正常,这周过后应该会出现魔改的版本。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值