![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法入门
一只小团子
这个作者很懒,什么都没留下…
展开
-
初级算法梳理(三)
1、信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 为了构造决策树,算法首先创建一个根节点,然后评估表中的所有观测变量,从中选出最合适的变量对数据进行拆分。为了选择合适的变量,我们需要一种方法来衡量数据集合中各种因素的混合情况。对于混杂程度的测度,有几种度量方式可供选择: 熵 I(x)I(x)I(x)被称为随机变量 x的自信息 (self-information),描述的是随机变量的某个...原创 2019-05-18 21:58:48 · 321 阅读 · 0 评论 -
初级算法梳理(二)
1、逻辑回归与线性回归的联系与区别 为什么使用逻辑回归进行分类:https://blog.csdn.net/lx_ros/article/details/81263209 2、 逻辑回归的原理 逻辑回归是利用回归类似的方法来解决分类问题。假设有一个二分类问题,输出y\in{0,1},而线性模型(下文将展示这个模型)的的预测值z是实数值,我们希望找到一个阶跃函数将实数z映射为{0,1},这样我们就...原创 2019-05-15 21:59:38 · 189 阅读 · 0 评论 -
初级算法梳理(一)
一、有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证 学习资料: 1、笔记《写给人类的机器学习 (Machine Learning for Humans)》 1、什么是有监督学习,什么是无监督学习。这两种方式之间的相同和不同点是什么? https://www.sohu.com/a/232571911_100178754 小结: 有监督学习,学习结果是已有的标签,相...原创 2019-05-12 21:52:31 · 363 阅读 · 0 评论