在前面的基础篇中,对某银行产品的电话营销结果进行了分析,寻找哪些参数是影响结果的主要因素。通过分析可以发现成功进行营销的规律,那么如何能够借助计算机将这些规律应用到对新用户是否能够成功营销进行预测呢?机器学习就是解决这类问题的手段之一,通过让机器学习历史的数据,自动发现其规律,并应用这个规律到新数据上,并给出预测结果。这大大减少了学习的时间和成本,并能做出比较准确的预测结果。接下来将会介绍一下如何使用机器学习来进一步挖掘数据,并做出预测。
在使用机器学习进行预测之前,首先需要配置机器学习的类库,在Python中使用最广泛的是Scikit-Learn这个类库。首先安装该类库到环境中,执行一下命令完成安装配置过程。$ pip install -U scikit-learn
执行成功后,就可以在Python中使用Scikit-Learn来进行预测结果。
这个例子使用的,银行电话营销的数据,首先引入需要的类库,并读入数据。
在进行机器学习的训练之前,需要先查看一下是否存在缺失值,如果有缺失值,则必须对缺失值进行处理。