读书笔记:《机器学习》
iamxiaofeifei
Thinking and coding...
展开
-
读书笔记《机器学习》:第一章:绪论
1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状1.1 引言通过基于经验预判的例子引出机器学习的概念。 Mitchell给出机器学习形式化的定义: 假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。1.2 基本术语数据集(dataset)原创 2017-08-21 11:33:33 · 487 阅读 · 0 评论 -
读书笔记《机器学习》:第二章:模型评估与选择
2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 比较检验 2.5 偏差与方差2.1 经验误差与过拟合错误率(error rate) 精度(accuracy): accuracy = 1 - error rate 误差(error) 训练误差(training error)/ 经验误差(empirical error) 泛化误差(generalization er原创 2017-08-21 13:18:27 · 549 阅读 · 0 评论 -
读书笔记《机器学习》:第十一章:特征选择与稀疏学习
11.1 子集搜索与评价 11.2 过滤式选择 11.3 包裹式选择 11.4 嵌入式选择与L1正则化 11.5 稀疏表示与字典学习 11.6 压缩感知11.1 子集搜索与评价特征选择(feature selection):从给定的特征集合中选择出相关特征子集的过程。是一个重要的数据预处理(data preprocessing)的过程。 相关特征(relevant feature) 无原创 2017-08-23 11:01:10 · 956 阅读 · 0 评论 -
读书笔记《机器学习》: 第三章:线性模型
3.1 基本形式 3.2 线性回归 3.3 对数几率回归 3.4 线性判别分析 3.5 多分类学习 3.6 类别不平衡问题3.5 多分类学习三种经典的拆解法: 一对一(One vs. One, OvO):N个类别两两配对,产生N(N-1)/2个分类器,测试的时候得到N(N-1)/2个结果,最终结果由投票结果决定。一对其余(One vs. Rest, OvR):每次把一个类的样例作为正例,原创 2017-08-24 09:38:24 · 363 阅读 · 0 评论 -
读书笔记《机器学习》: 第八章:集成学习
目录: 8.1 个体与集成 8.2 Boosting 8.3 Bagging与随机森林 8.4 结合策略 8.5 多样性8.1 个体与集成集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务。 同质集成:同质集成中的个体学习器也叫基学习器(base learner) 异质集成:异质集成中的个体学习器一般称组件学习器(component learner)原创 2017-09-06 21:36:25 · 1136 阅读 · 0 评论 -
读书笔记《机器学习》: 第四章:决策树
4.1 基本流程 4.2 划分选择 4.3 剪枝处理 4.4 连续与缺失值 4.5 多变量决策树4.1 基本流程决策树的流程遵循简单且直观的分而治之的策略。 决策树的生成是一个递归过程。其终止条件主要有三个: 1.当前节点所包含的样本全部属于同一类别,无法划分 2.当前属性集为空,或是所有样本在所有属性的取值相同,无法划分,直接把该节点的类别设定为所含样本做多的类别。 3.当前节点所原创 2017-08-30 09:59:50 · 539 阅读 · 0 评论