- 博客(3)
- 收藏
- 关注
原创 西瓜书第4章学习笔记
4.1基本流程决策树的概念:基于树结构进行决策,包含根结点、若干内部结点和若干叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。每个结点包含的样本集根据测试结果被划分到各个子结点中,根节点包含所有样本集。遵循“分而治之(divide-and-conquer)”策略。4.2划分选择总体目标是:决策树的分支结点所包含的样本尽可能属于同一类别,即结点的纯度越来越高。三种划分的选择:信息增益、增益率和基尼指数信息增益:增益率:基尼指数:4.3剪枝处理“剪枝”主要是..
2021-11-25 23:52:00 730
原创 西瓜书第3章学习笔记
目录3.1基本形式3.2线性回归3.3对数几率回归(逻辑回归)3.4线性判别分析(Linear Discriminate Analysis,LDA)3.5多分类学习3.6分类不平衡问题机器学习三要素:模型——根据具体问题,确定假设空间;策略:根据评价标准,确定选取最优模型的策略;算法——求解损失函数,确定最优模型注:西瓜书第3章学习的时候参考了南瓜书以及斯坦福吴恩达老师的课程。3.1基本形式线性模型的一般表达式写成向量形式为3.2线性回归
2021-11-22 23:00:42 307
原创 西瓜书第1、2章学习笔记
谈论算法的相对优劣,必须要针对具体的学习问题。【一、基本概念】(仅记录自己不太熟悉或需要记忆的概念)属性空间 (attribute space):属性张成的空间,也称为样本空间(sample space)或输入空间。真相、真实(ground-truth):潜在规律自身。标记空间(label space):所有标记的集合,也称输出空间。泛化(generalization)能力:学得模型适用于新样本的能力。归纳(induction):从特殊到一般的泛化过程。演绎(deduction)
2021-11-17 00:46:18 659
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人