案例数据集来源于UCI网站。案例是基于一家葡萄牙金融机构的电话销售数据。营销目标是确认客户是否愿意认购银行发行的一款定期储蓄产品。该数据集内包含41188条记录和20个特征变量,和1个分类变量。变量包括类别型,字母型,和数值型。
决策树分类算法是机器学习中的一个基础且非常重要的算法。它利用不纯度函数,比如,信息熵来度量信息。分类决策树利用特征变量的信息熵对数据进行划分。Python的优势在于开源,基于Python的各类机器学习算法非常丰富而且方便使用。我们将以银行产品销售案例数据集为一个点的同时,讨论决策树分类原理和Python算法并用他们来解决银行产品销售问题的预测分类。
本案例的特点是将银行产品销售的金融决策问题的解决方案与机器学习中的决策树算法进行结合,并利用Python设计一个自动分类算法来对案例数据集进行学习并辅助我们进行决策。这三者的结合就是智能金融在金融行业的一种经典应用。
学生通过本案例的学习将能够充分理解并在未来能够使用决策树算法和Python程序来解决一个具体金融决策问题。本案例中还将介绍数据预处理和变量工程概念,从而有助于学习数据处理的方法和技巧。
学生将获得本案例的Python源代码。