- 博客(3)
- 收藏
- 关注
原创 python-机器学习-决策树-decision tree
以是否有房这个特征为例子,在有房子的人当中,不是所有的都是可选择的监护人,也不是所有没有房子的都不适合做监护人。我一开始做的时候个人主观觉得房子很重要,但是根据数据计算出来的gini系数,月薪是否过万这个特征变量才是最好的。比如 是否有房可以筛选出四个符合条件的监护人,是否有车可以是筛选出3个,月薪是否过万,可以选择出4个。对了,文章一开始作为例子贴的那张根节点的图是错误的,我们不应该选择是否有房作为根节点。根节点也就是最重要的特征,在选择监护人的例子里面,我们选择是否有房作为根节点。...
2022-08-18 17:26:52 585
原创 plotly.express同一个dataset,做多个子集,颜色设置
我一开始有三个dataset,分别是no_bureau(没有信用记录),young_to_bureau(信用记录很短暂),mature_to_bureau(信用记录较久)。具体代码data1.insert(loc=1,column='segment',value='no_bureau')segment这一列中有三个变量no_bureau,young_bureau,mature_bureau.具体代码data1=data1.iloc[,[0,9]]-----提取第0,和9。...
2022-07-29 15:30:56 632
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人