写在前面
细节展示
本节重难点
关于学习方法的思考
01、写在前面
本项目来自于阿里天池实验室,数据挖掘训练营。地址:AI训练营-阿里云天池 (aliyun.com)
02、细节展示
03、本节重难点
项目实现完整流程:
- 赛题理解
- 数据分析
- 特征工程
- 建模调参
- 模型融合
- 二手车交易价格预测
赛题理解(重难知识点)
- 评估标准:对模型效果好坏的量化打分。
- 本赛题的评价指标MAN(mean absolute error)即平均绝对误差。需手写计算公式
- 一般回归问题的评价指标:平均绝对误差(Mean Absolute Error,MAE),均方误差(Mean Squared Error,MSE),平均绝对百分误差(Mean Absolute Percentage Error,MAPE),均方根误差(Root Mean Squared Error), R2(R-Square)
- 分类算法常见的评估指标如下:
对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。
对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。
5、下载并读取数据:手录代码
6、sklearn.metrics模块含有需要的评估指标。例如:accuracy,recall,ROC,MAN,MSN等。
04、关于学习方法的思考
在做中学是比较高效的方法。具体呢,就是找一个项目来做。啃得过程中遇到看不懂的地方需要查阅资料。不需要深究,只需要知道它是干什么的,大约怎么用。(前提是python基础,一些第三方库基础操作要能看懂,但不要求特别深入、熟练)。
最后一句话结束本章:前路漫长,诸君共勉!