DCIC 2020:智慧海洋建设 开源方案复盘笔记
一、赛题介绍
1.1 赛题背景
本赛题基于位置数据对海上目标进行智能识别和作业行为分析,要求选手通过分析渔船北斗设备位置数据,得出该船的生产作业行为,具体判断出是拖网作业、围网作业还是流刺网作业。初赛将提供11000条(其中7000条训练数据、2000条testA、2000条testB)渔船轨迹北斗数据。
1.2 赛题数据
初赛提供11000条渔船北斗数据,数据包含脱敏后的渔船ID、经纬度坐标、上报时间、速度、航向信息,由于真实场景下海上环境复杂,经常出现信号丢失,设备故障等原因导致的上报坐标错误、上报数据丢失、甚至有些设备疯狂上报等。
数据示例:
- 渔船ID:渔船的唯一识别,结果文件以此ID为标示
- x: 渔船在平面坐标系的x轴坐标
- y: 渔船在平面坐标系的y轴坐标
- 速度:渔船当前时刻航速,单位节
- 方向:渔船当前时刻航首向,单位度
- time:数据上报时刻,单位月日 时:分
- type:渔船label,作业类型
原始数据经过脱敏处理,渔船信息被隐去,坐标等信息精度和位置被转换偏移。 选手可通过学习围网、刺网、拖网等专业知识辅助大赛数据处理。
1.3 评估指标
提交结果与实际渔船作业类型结果进行对比,以3种类别的各自F1值取平均做为评价指标,结果越大越好,具体计算公式如下:
其中P为某类别的准确率,R为某类别的召回率,评测程序f1函数为sklearn.metrics.f1_score,average='macro'。
二、Baseline 1
2.1 Baseline 概况
Baseline Auhtor : 阿水
Baseline Address :