1、初期准备
开始学习机器学习,我看的是《机器学习实战:基于ScikitLearn和TensorFlow》这本书,我觉得写的挺好,如果你是初步入门的话,这本书边看可以边学,对于入门比较好一点,个人觉得。
1.准备Anaconda,直接去官网下载,然后在jupyter notebook中运行自己的代码。
2.在jupyter notebook中建好自己的一个文件夹,方便后续写代码。
2、实战介绍
开始找一个题目来练手,这是一个关于二手车交易价格预测的题目,首先看一下这个题目。
2.1题目要求
该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。从中抽取15万条作为训练集,5万条作为测试集,同时会对name、model、brand和regionCode等信息进行脱敏(数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。)下面是它的一个字段介绍
然后是它的评判标准:
这里扩展一下:
MSE:均方误差