Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1
使用语言:python
Tas1 – Task5
Task1
赛题理解:
本次学习数据挖掘所用到的数据来自某交易平台二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。
Task01主要是以下几个点:
- 对于本次赛题背景知识的概览
- 对于本次使用的原始数据的预处理
- 初步了解不同的评价指标
本次评价标准为MAE(Mean Absolute Error):
MAE=\frac{\sum_{i=1}^{n}\left|y_{i}-\hat{y}_{i}\right|}{n}
通过查阅相关资料,发现平均绝对误差(MAE)经常会与均方误差(MSE)和均方根误差(RMSE)进行比较,因此通过他们的方程式来看具体不同:
MAE:
RMSE:
MAE:
以上三种通常可以评价数据的变化程度,只是各自的取值范围不同:MSE、RMSE的值越小,说明预测模型描述实验数据具有更好的精确度。
- 个人感悟:这是第二次参与Datawhale的项目;和上一次相比都是比较基础的数据挖掘类赛题;本次的目标就是更加熟悉对于不同类型数据的处理以及在建模调参中不断优化得到更好的结果。