自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 决策树算法梳理

信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度)熵:用来度量随机变量的不确定性,是信息的期望值。当熵越大,概率说X=xi的不确定性越大,反之越小。熵越大即这个类别的不确定性更大,反之越小联合熵:X,Y同时发生的信息熵信息增益:信息增益是用来选择特征,信息增益越大,则这个特征的选择性越好基尼不纯度:将来自集合中的某种结果随机应用于集合中某一数据项的预期误差率**决策树的不同分...

2019-03-05 16:45:31 143

原创 逻辑回归算法梳理

逻辑回归与线性回归的联系与区别联系:逻辑回归是一种广义的线性回归模型。区别:线性回归w’x+b逼近y,逻辑回归w’x+b逼近y的对数几率函数,多了一个Sigmoid函数,使样本能映射到[0,1]之间的数值,用来做分类问题。不同的就是因变量不同,如果是连续的,就是多重线性回归,如果是二项分布,就是logistic回归。线性回归用来预测,逻辑回归用来分类。线性回归是拟合函数,逻辑回归是预测函数。...

2019-03-03 12:51:33 177

原创 线性回归算法梳理

1.机器学习的一些概念有监督:提供有已知输入向量和输出向量所构成的“样本对”集。无监督:学习前,只提供已知输入向量构成的“样本”集。泛化能力:是指一个机器学习算法对于没有见过的样本的识别能力,举一反三、学以致用的能力。过拟合:模型的复杂度较高,或者训练数据较少,模型含有训练集的特有信息,对训练集过于依赖,模型会对训练集高度敏感,会产生过拟合现象。欠拟合:模型的复杂度较低或者训练数据过少,...

2019-02-28 19:57:13 160

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除