机器学习
只为心中梦
喜欢编程,喜欢探索,欢迎大佬们提意见
展开
-
机器学习基础算法梳理
1. 机器学习的一些概念有监督:给学习算法一个数据集。这个数据集由“正确答案”组成。监督 学习分为回归和分类。无监督:给定一组数据,这组数据没有任何标签。我们的目标是发现数据中的特殊结构。泛化能力:是指一个机器学习对于未见过的样本的识别能力。或者称为举一反三或者学以致用的能力。过拟合:学习时选择的模型包含的参数过多,以致于出现这一模型对已知数据预测得很好,对未知数据预测得...原创 2019-02-28 16:47:17 · 361 阅读 · 0 评论 -
机器学习算法基础---逻辑回归
逻辑回归与线性回归的联系与区别第一条:回归模型就是预测一个连续变量(如降水量,价格等)。在分类问题中,预测属于某类的概率,可以看成回归问题。这可以说是使用回归算法的分类方法。第二条:直接使用线性回归的输出作为概率是有问题的,因为其值有可能小于0或者大于1,这是不符合实际情况的,逻辑回归的输出正是[0,1]区间。线性回归只能预测连续的值,分类算法是输出0和1.第三条:线性回归中使用的是最小...原创 2019-03-02 11:30:01 · 801 阅读 · 0 评论 -
决策树算法梳理
1.信息论基础信息熵:信息熵是度量样本的集合纯度最常用的一种指标。在信息论和概率统计中,熵是表示随机变量不确定性的度量。联合熵:两个随机变量X,Y的联合分布,可以形成联合熵Joint Entropy,用H(X,Y)表示。条件熵:设有随机变量(X, Y),其联合概率分布为条件熵H(Y|X) 表示在已知随机变量X的条件下随机变量Y的不确定性。随机变量X给定条件下随机变量Y的条件熵H(Y|X),...原创 2019-03-05 16:00:14 · 515 阅读 · 0 评论