自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 随机森林里oob_score以及用oob判断特征重要性的理解

本文总结了我在学习随机森林时关于oob产生的一系列问题以及学习到的问题答案1. 什么是oob2. 什么是oob_score3. 如何用oob判断特征的重要性错误理解与纠正参考文章在学习随机森林算法参数解释以及参数择优的过程中,注意到oob_score这一参数对应是否采用袋外样本来评估模型的好坏。同时在学习随机森林的优点时,其中一条是训练后可以给出各个特征对于输出的重要性。一开始未能清楚理解该优点的理论原因是什么,但在今天学习oob_score的时候,我就想这个优点是不是就是基于oob实现的(不是!具体

2021-03-21 11:49:54 21876 9

原创 决策树ID3算法中导致递归返回的三种情况

本文主要对三种递归返回作出解释,ID3基本算法请大家自行搜索大佬们的绝美解释在学习决策树ID3算法的过程中,发现很多文章都非常详细的讲解了利用信息增益挑选特征的过程,但是对三种递归返回情况都是重复以下几句话。在决策树基本算法中,有三种情形会导致递归返回:当前结点包含的样本全属于同一类别,无需划分,直接把该结点做为叶结点,类别划分为该结点下所有样本同属的类别;当前属性集为空,或者所有样本在所有属性上取值相同,无法划分,直接把该结点做为叶结点,类别划分为该结点下各路大佬们再次默认小菜鸡一定能明白…

2021-03-18 07:36:17 1592 5

原创 为什么不能直接用线性回归做分类(loss function角度)

本文将对在做分类问题的时候不选用线性回归而是选用以Sigmoid函数作为拟合函数的逻辑回归作出两点解释。1.线性回归中返回的是连续的预测值(-∞,+∞),而不是便于判断类别的概率 [0,1]通过线性回归和逻辑回归的拟合函图像数我们可以看出,线性回归的范围在(-∞, +∞),而逻辑回归的范围在[0,1]之间,我们可以比较方便的根据概率(即g(x))的大小来判断类别。(比如,当g(x)>0.5,我们可以认为y = 1)2.当用线性回归做分类问题时,预测结果极易受到极端值的影响。接下来从损失函数作

2021-03-16 09:19:46 2043

原创 Colab .ipynb 从本地/云端/GitHub 导入并使用.py文件

Google Colab 从本地/云端/GitHub 导入并使用.py文件 的各种尝试以及最后方法欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你

2020-10-11 02:11:45 3357 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除