背景和一些小知识
其实,我是萌新一枚,hhh~~
下面简单分享一下我的学习过程,希望能帮助更多的萌新。
首先,我对机器学习有了一些简单的知识概念,但是,对于我这么一个从程序员过渡算法的小白来说,仅仅给我灌输理论知识是不够用的,我需要自己走一遍流程,我才能进一步掌握机器学习或者说数据挖掘到底是一个怎样的过程。
上面说的流程是指:
(1) 定义模型
(2) 训练模型
(3) 用模型做预测/分类等等
(4) 评估模型
这个流程基本上贯彻我们做算法的每个项目,每个算法项目比作的一个流程,一步都不能少。简单说一下,这个流程的每个步骤的含义:
1.定义模型:首先,你有一个数据集,那么你用这个数据集来训练出一个模型,那你要选择一种方法来训练模型吧?你要选什么样的方法来训练模型呢?机器学习里训练模型的方法非常之多,SVM(支持向量机)、神经网络、贝叶斯等等。这里我要做房价的预测,我选用的是随机森林,随机森林不单只可以做预测,还可以做分类,甚至还能做回归问题。虽然我使用的随机森林比较简单,但是也算是一种入门了吧。
2.训练模型:确定了要选择的训练方法之后,就可以使用这种方法,把训练集丢进去,让他自己训练。那这些训练方法哪里来的呢?这里我们使用python里面的库,比如sklearn库里面的随机森林、评估方法等等。
3.用模型做预测:第二步的时候,我们已经丢训练集进去训练好模