自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 《统计学习方法》笔记(六)--决策树

可以用于分类和回归,书中只介绍分类树用于分类 定性:是一种判别式模型 思路:利用训练数据,根据损失函数最小化的原则建立决策树模型,对于新的数据利用建立的决策树进行分类 决策树学习的主要步骤:特征选择,决策树的生成和决策树的修剪。 主要算法:ID3,C4.5,CART 1.关于决策树模型 定义:一种描述对实例进行分类的树形结构。 组成:结点(内部结点,叶节点)、有向边。其中内部结点表示

2015-06-30 08:43:17 760

原创 《统计学习方法》笔记(五)--朴素贝叶斯

定性:生成式模型,用于分类 基于贝叶斯定理和特征条件独立的假设。 目标:是得到特征X=x的条件下Y等于各个yk的概率大小。 思路:由训练集得到先验概率,条件概率;将测试点代入通过贝叶斯公式计算后验概率(计算中用到了条件独立的假设);极大化这个概率得到合理的预测。 模型:极大化后验概率 策略:用到的是极大似然估计,也就是期望风险最小化中的L取0-1损失函数 算法: 实现:MATLAB中

2015-06-29 08:21:46 361

原创 《统计学习方法》笔记(四)--k近邻法

K-nearest neighbor 可以用来解决分类问题与回归问题 是一种判别式模型 三要素:k值的选择、距离度量及分类决策规则。 基本思路:给定一个训练集合,当测试数据到来时,根据某种距离度量找到与其最邻近的k个实例,这k个实例中的大多数属于哪个类别,那么测试数据就被归类于哪个类别。 1.模型:关于特征空间的一个划分。 距离度量:欧式距离,LP距离,马氏距离。。。 k值选择:k

2015-06-28 21:08:51 339

原创 统计学习方法(三)--感知机

定性:是一种二类分类的线性模型,属于判别模型(即从数据中直接学习得到的模型)旨在求出将训练数据进行线性划分的分离超平面。求得感知机模型的方法思路:利用梯度下降法对基于误分类点的损失函数进行极小化。下面分别从模型,策略,算法三个方面展开描述1.模型定义:f(x)=sign(w*x+b) 其中x是特征向量,w是权值向量,b叫偏置是一个数 几何解释:w*x+b=0对应于特征空间中的超平面S,w是超平面

2015-06-27 09:36:48 378

原创 《统计学习方法》笔记(二)

统计学习方法三要素: 1.模型 分为概率模型(条件概率分布)和非概率模型(决策函数) 2.策略 损失函数和风险函数 风险函数又分为经验风险和结构风险 3.算法 根本是在解决最优化问题

2015-06-26 08:50:09 214

原创 《统计学习方法》笔记(一)

一、概论 “学习”,如果一个系统能够通过执行某个过程而改进它的性能,这就是学习。——Herbert A.Simon 基本假设:同类数据具有一定的统计规律。(这个假设是否有不成立的时候) 目的:考虑学习什么样的模型,如何学习模型,以使得模型能对数据准确的预测和分析。 方法:监督学习;非监督学习;半监督学习;强化学习。 要素:模型;策略;算法。 应用:分类;标注;回归。 本书主要讨论监督

2015-06-25 08:30:36 257

原创 无中生有

希望在这里留下我的足迹,每天都能记下学到的东西。 轻轻的问问自己,今天你是否学到了什么?如果没有,那么抓紧时间吧,不然明天清晨又没什么可写的了;如果有,那么理清思路并牢记它,至少保证在明天清晨之前不会忘记它!

2015-06-24 13:48:32 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除