学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification
Task 2 学习内容:EDA
这个Task主要学习的是对数据的EDA工作,大致包含以下几部分内容:
- 载入各种数据科学以及可视化库
- 载入数据
- 数据总览
- 判断数据缺失和异常
- 了解预测值的分布
EDA, 探索性数据分析,也称描述性数据分析。主要是看一下数据的大致情况。
本次数据为心电信号数据,三个维度分别为id, 心电信号以及label, 心电信号部分后续需要进行进一步的分割。
数据没有缺失值,所以没有进行缺失值处理
总体而言,这一节只是对数据进行简单的直观了解。为后续的数据预处理以及有目标有方向的特征工程做准备。