在我们准备用机器学习构建一个分类器来处理实际问题时,还需要做些其他的准备工作:
1. 根据你的问题选择一种合适的机器学习方法,因为每种机器学习的算法都有各自不同的特点,能适应的场景也不同,所以选择合适的机器学习方法事半功倍。
2. 根据你的问题选择合适的特征来进行分析,因为事物之间都有自己的特征,选择好事物独特的特征来进行也能提高训练效果。
3. 根据你的问题设置合适的分析模型参数,每一种机器学习算法都会依据模型参数设置决策边界。
机器学习的一般步骤可以归纳为两个:
- 训练
- 测试
训练
这一步主要是根据数据确定用于训练的特征向量,然后设置训练的参数,构建分类器模型。
- 为了得到高精度的预测,选择合适的特征是非常重要的。另外,每一种机器学习方法都有各自的特征数据类型的格式,例如算法模型接受(x,y)作为参数,那么有的x,y可能只能是0、1;有的可能是其他的要求。
- 每一种机器学习方法都有一套独特的参数集,如逻辑回归,需要调节的通常只有正则项系数C;如随机森林,需要调节的变量会多出不少;再如神经网络中的神经元个数…在训练的过程中,模型的参数会根据测试的结果不断的被修改和调整,直到找到合适的模型。
测试
根据测试数据集确定用于测试的特征向量,注意,训练和测试的数据集是不同的