机器学习
美式半糖不加奶
这个作者很懒,什么都没留下…
展开
-
ML算法——随机森林
文章目录1、套袋法Bagging1.1 袋外数据1、套袋法BaggingBagging的弱学习器之间没有boosting那样的联系,它的特点是随机采样,一般是自主采样法(Bootstrap sampling):从训练集中裁剪固定个数的样本,但每采集一个样本后,都将样本放回。(1) 从原始样本集中有放回的随机抽取n个训练样本,独立进行k轮抽取,得到k个训练集(2) 独立训练k个模型(基学习...原创 2020-03-30 16:37:38 · 219 阅读 · 0 评论 -
ML算法——决策树
文章目录1、 ID3算法1.1信息熵1.2 信息增益1、 ID3算法1.1信息熵衡量不确定性的指标,信息熵越大,不确定性越大度量样本集合纯度的一种指标,值越小,样本集合的纯度越高H(D)=−∑k=1Kpklog2(pk) H(D)=-\sum_{k=1}^{K}p_{k}log_2(p_k)H(D)=−k=1∑Kpklog2(pk)熵H(Y)表示随机变量Y的不确定性程度条件...原创 2020-03-26 23:33:26 · 520 阅读 · 0 评论