- 博客(2)
- 收藏
- 关注
原创 任务3 - 决策树算法梳理
信息论基础熵:度量样本集合纯度最常用的指标,是对所有可能发生的事件产生的信息量的期望。假设当前样本集合D的第k类样本比例为Pk(k=1,2,3,…,|y|),则D的熵定义为联合熵:样本类别越多,状态数也就越多,熵就越大,混乱程度就越大。当样本类别为均匀分布时,熵达到最大,且 0≤Ent(D)≤logn。将一维随机变量分布推广到多维随机变量分布,则其联合熵 (Joint entropy...
2019-04-03 21:07:25 714
原创 任务2 - 逻辑回归算法梳理
逻辑回归与线性回归的联系与区别联系:逻辑回归是在线性回归模型的基础上取对数,使模型更逼近y值,是广义线性回归的一个特例。形式上,两者都是线性回归。区别:逻辑回归是已求取的输入空间对输出空间的非线性映射,而线性回归是线性映射。逻辑回归多用于分类,线性回归多用于预测逻辑回归针对非连续变量,线性回归针对连续变量2、 逻辑回归的原理逻辑回归是用线性回归模型对数的预测结果逼近真实标记的对...
2019-04-01 17:40:50 372
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人