读书笔记:统计学习方法---李航
xiaozi-ML
这个作者很懒,什么都没留下…
展开
-
第一章 统计学习方法概论
1、统计学习:是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科2、统计学习主要特点:(1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的(2)统计学习以数据为研究对象,是数据驱动的学科(3)统计学习的目的是数据进行预测与分析(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析(5)统计学习是概率、统计学、信息论、计算理论、最优化理论原创 2015-03-20 23:47:49 · 687 阅读 · 0 评论 -
第三章 K近邻法(k-nearest neighbor)
1、K近邻法(k-nearest neighbor):是一种基本分类与回归方法。 输入:为实例的特征向量,对应于特征空间的点; 输出:为实例的类别,可以取多类。 基本思想:假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,k最近邻法不具有显式的原创 2015-03-21 23:01:16 · 834 阅读 · 0 评论 -
第四章 朴素贝叶斯法
1、朴素贝叶斯法(naive Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法。算法基本思路: 对于给定的训练数据集,首先基于特征条件假设学习输入/输出的联合概率分布; 然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。2、朴素贝叶斯法对条件概率分布作了条件独立性的假设。3、朴素贝叶斯法实际上学习到生成数据的原创 2015-03-22 10:22:22 · 505 阅读 · 0 评论 -
第五章 决策树
1、决策树(decision tree):是一种基本的分类与回归方法。 呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。 可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。 主要优点:模型具有可读性,分类速度快。 学习时,利用原创 2015-03-23 10:27:33 · 645 阅读 · 0 评论