数据科学技术与应用
机器学习建模分析(二) 第七次作业 答案
题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用
1 ( 100分 ) 基于bankpep.csv数据集,划分训练集与测试集,建立分类模型。
1)使用决策树建立分类模型,记录模型在测试集上的性能;
2)自学朴素贝叶斯、支持向量机建立分类模型的方法,记录模型在测试集上的性能;
3)使用使用梯度提升机以及XGBoost训练分类模型,并与步骤1、2的结果进行比较。
4)本次作业需提交源代码和结果分析报告,分析报告说明使用的数据集,数据集特征项、数据量大小、尝试的每种方法、获得的结果。最后绘图比较这些方法在性能上的差别。
import pandas,datetime,xgboost
from sklearn