自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 2021-04-01

????回归树是怎么处理回归问题的?用决策树做分类或回归任务时,从根节点开始,对样本的某一特征进行测试,根据测试结果,将样本分配到其子结点;这时,每一个子节点对应着该特征的一个取值。如此递归地对样本进行测试并分配,直至到达叶结点。假如我们有n个特征,每个特征有si(i∈(1,n)),si(i∈(1,n))个取值,那我们遍历所有特征,尝试该特征所有取值,对空间进行划分,直到取到特征j的取值s,使得损失函数最小,这样就得到了一个划分点。????GBDT的原理是什么, 梯度怎么理解, 残差怎么理解?建立一个

2021-04-01 22:03:18 63

原创 2021-03-31

深入了解数据然后填补缺失值1.机器学习:将缺失值作为目标向量,使用相关联的特征预测填充2.使用均值,中位数,众数填充特征扩增从哪几个方向入手?1.对连续数据进行分箱2.对离散数据进行独热编码3.组合新的特征,不同特征进行加减乘除等操作...

2021-03-31 00:09:24 49

原创 2021-03-29

数据挖掘的流程是怎样的?1.判断问题是属于分类问题还是回归问题2.数据清洗:处理空值,重复值,异常值3.选择特征4.划分训练集和测试集5.建立模型数据探索阶段的方向是什么,应该从哪些方向入手?1.按变量类型进行分类,;离散或连续2.判断特征与标签是否关联3.判断特征之间的关联性4.删除不必要的特征或者建立新的特征5.特征的可视化...

2021-03-29 22:14:03 44

原创 2021-03-27

建模流程的代码有哪几个部分?分别如何实现1导入包from sklearn.model_selection import train_test_split #数据拆分from sklearn.model_selection import GridSearchCV#网格搜索from sklearn.linear_model import LogisticRegression #逻辑回归模型#决策树from sklearn.tree import DecisionTreeClassifierfrom

2021-03-27 20:46:02 53

原创 2021-03-25

CART是什么?CART分类的原理是什么?分类回归树。分类树基于训练集基尼系数最小选取局部最优特征,启发式递归构建决策树并剪枝。测试集根据对应属性自上而下走,以叶子结点标签占比为分类依据达成分类目的。CART和ID3,C4.5有什么异同点1. ID3,C4.5支持分类模型,而CART不仅支持分类模型还支持回归模型2 .ID3,C4.5支持多叉树,而CART支持二叉树3 .ID3用信息增益选择特征,C4.5用信息增益比选择特征,CART用基尼系数、均方差选择特征4 .ID3不支持连续值,缺失值的处

2021-03-25 22:37:00 68

原创 2021-03-24

决策树如何做分类的每次判断样本的一个特征,根据所有的判断结果给出分类决策树分类算法有哪些,原理是什么?ID3算法:根据信息熵选择可以带来最大信息增益的属性.从根节点开始,对节点计算所有可能的特征的信息增益,选择信息增益最大的特征作为节点的特征,由该特征的不同取值建立子节点;再对子节点递归的调用以上方法,构建决策树;直到所有特征的信息增益均很小或没有特征可以选择为止。缺点:没有考虑连续特征;采用信息增益大的特征优先建立决策树的节点;没有考虑缺失值 C4.5算法:将ID3算法的信息增益改为信

2021-03-24 23:41:36 33

原创 2021-03-23

模型评估的方式:一…回归模型:1.平均绝对误差指预测值和真实值之间平均相差多少,更好地反映预测值真实的误差情况2.平均方差观测值与真值偏差的平方和与观测次数的比值,评价数据的变化程度,值越小,说明预测模型描述实验数据具有更好的 精确度3.R决定系数评估拟合好坏,实际取值范围[0,1], 越接近1拟合效果越好4.交叉验证原始数据进行分组,一部分做为训练集,另一部分做为验证集二.分类模型:1.精确率,召回率,准确率,F1调和均值准确率:对于给定的测试集,分类模型正确分类的

2021-03-23 22:18:45 171

原创 2021-03-22

3.22每日总结

2021-03-22 22:19:46 55

空空如也

python 分配物品

2023-07-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除