实操笔记
文章平均质量分 62
袁钰琦
这个作者很懒,什么都没留下…
展开
-
使用决策树进行个人信用风险评估代码
使用决策树进行个人信用风险评估第一步,导入csv文件的数据集使用UCI上的德国信用数据集。该数据集包含了1000个贷款信息,每一个贷款有20个自变量和一个类变量记录该笔贷款是否违约。我们将使用该数据集构建模型来预测贷款是否违约。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltcredit = pd.read_csv("data/german_credit.csv")第二步,观察数据集可根据一些函数来原创 2021-09-19 13:17:15 · 2324 阅读 · 1 评论 -
使用sklearn建立决策树模型代码
使用sklearn训练模型并预测结果定义数据def loaddata(): dataSet = [[0, 0,0,0, 'no'], [0, 0,0,1,'no'], [0, 1,0,1, 'yes'], [0, 1,1,0, 'yes'], [0, 0,0,0, 'no'], [1, 0,0,0, 'no'], [1原创 2021-09-19 10:57:23 · 1227 阅读 · 1 评论 -
动手实现ID3决策树代码
ID3决策树本文从计算数据集的信息熵、划分数据集、选择最优特征、递归训练一棵树、预测五个方面介绍怎样构建ID3决策树。先要介绍信息熵和信息增益的这两个公式:Ent(D)=−∑k=1∣Y∣pklog2pk\operatorname{Ent}(D)=-\sum_{k=1}^{|\mathcal{Y}|} p_{k} \log _{2} p_{k}Ent(D)=−k=1∑∣Y∣pklog2pkGain(D,a)=Ent(D)−∑v=1V∣Dv∣∣D∣Ent(Dv)\operatornam原创 2021-09-17 22:36:18 · 521 阅读 · 0 评论