华为云-东吴杯

最新推荐文章于 2024-07-22 09:16:52 发布

Fox9306

最新推荐文章于 2024-07-22 09:16:52 发布

阅读量362

点赞数

分类专栏：神经网络 system 文章标签：机器学习 python

本文链接：https://blog.csdn.net/weixin_43936828/article/details/117949078

版权

神经网络同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

system

4 篇文章 0 订阅

订阅专栏

东吴杯

暂略

介绍

暂略

数据

目前于2021-06-16更新取得
等待赛事方baseline的提出，数据存在一定的噪声，如果使用python读取的话参考的参考如下形式：
官方未标明可以公开，故不放图片和label数据等，提供大致思路。

import json
import cv
filename = "./xxx.json"
with open(filename) as f:
    json_data = json.load(f)
for json_dict in json_data:
    if(json_dict==KeyValue):
         data = json_data[json_dict]
    if(......):
    	label=json_data[json_dict]
"""
read the data just like the width height  label and filepath 
出于对于噪声问题
""" 
// step2 select and remove the noisy data
xy 坐标等问题缺少值

label标签位于shapes下

//step 2 logical method
for key in label:
	 strname = list(key.keys())
	 values = list(key.values())
	 points = values[3]
	 //增加筛选机制，对noisy进行筛选
	 label_name = strname[0]

上述逻辑差不多可以完成数据的筛选和构建基础训练集
当然出于Traindata 和Valdata，需自己采用shuffle打乱的方式

//step3 shuffle the data
//可采用Random取值进行分散数据的形式，基础方式

对于数据是否增强和pre-process 等问题，初步查看数据样本，背景较为单一，物体采用旋转的方式对各个角度进行拍摄获得样本。对于目标的xywh的问题，存在大量小目标检测，推荐进行一定的pre-process

//step 4 Data Augmentation
//待定

当然上述逻辑采用个人见解，官方会提供baseline解法，对于想自定义的来说，可作为参考。
当然出于模型和样本，整个样本集，需进行一定的Data Cleaning，并非仅仅存在坐标Noisy现象，也许不排除存在错标等现象。
后续仍会进行更新

baseline模型

2021-06-17 20:00 更新
官方放出baseline模型，从.pth模型文件命名来看，主办方用的baseline:fasterrcnn_resnet50_fpn，那么首先问题先是跑通再是解析baseline或者构建自己的想法数据集，跑通过程全程参考官方数据提供的args。为了走通一遍流程，目前测试良好。
在这里插入图片描述
中间逻辑测试输出log产生small bbox直接ignore
目前先测试，今晚23:00查看结果。
2021-06-18
baseline测试，准确率都为0.51左右，第二天嘛，正常，这周过后应该会出现魔改的版本。

Fox9306

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
华为云-东吴杯

东吴杯暂略介绍暂略数据目前于2021-06-16取得等待赛事方baseline的提出，数据存在一定的噪声，如果使用python读取的话参考的参考如下形式：官方未标明可以公开，故不放图片和label数据等，提供大致思路。import jsonimport cvfilename = "./xxx.json"with open(filename) as f: json_data = json.load(f)for json_dict in json_data: if(jso
复制链接

扫一扫

专栏目录