机器学习-读书笔记

集成学习
  1. 如何发现弱学习算法?

  2. adaboost

    • 弱分类器的系数是怎么计算出的,为什么要这样计算?目的:最小化指数损失函数
    • 迭代生成弱分类器过程中错误率大于0.5,break 之后怎么办???—>>抛弃当前的基学习器
    • 指数损失函数与0-1损失函数效果一致的证明
    • 每次新分类器系数得到的方法–>使得最小化指数损失函数(因为总分类器是加权和,所以可以这样做)
    • zm 怎么推导出的,watermelon,P176,最后一步
    • 不需要知道下界??,下界为零??,lihangP143
Bagging与随机森林
  1. 如果采样出的每个子集都完全不同,每个基学习器都只用到一小部分训练数据,便不能进行有效的学习—>> 特定类型样本的预测不能通过不同的基学习器共同作用来实现,也就失去了提升(boost)的目的,—>> 采用相互有交叠的采样子集,(但是为了体现差异,又不能交叠太多!!–>> 如何把握?
  2. 63.2% ?? –> 如何按照需求调整?重复的怎么办?
  3. 决策树:

    • 注意标记叶节点的方式,是该节点还是该节点的父节点所含样本最多的类别??
    • C4.5算法不是使用增益率最大的属性,而是实用了一个启发式:从高于平均增益的属性中选择增益率最高的
    • 数据集的纯度除了用熵表示,还能用基尼指数度量:CART决策树
    • 划分节点带来泛化性能的提升,怎么度量??<—> 与过拟合成双成对,这里采用留出法,是否有其他方法???
  4. 随机森林

    • 核心:样本扰动,属性扰动(样本扰动是因为RF构建是在Bagging的基础上)
    • UCI数据
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值