西瓜书
岛民浩哥
这个作者很懒,什么都没留下…
展开
-
【西瓜书阅读笔记】第9章 聚类
第9章 聚类9.1 聚类任务9.2 性能度量9.3 距离计算三级目录 9.1 聚类任务 无监督学习任务中,研究最广泛——聚类 聚类:试图将数据集的样本划分为若干个通常不相交的子集,每个子集称为一个“簇” 聚类算法涉及2个基本问题: 性能度量 距离计算 9.2 性能度量 性能度量,也称有效性指标 希望:簇内相似度高,且簇间相似度低 聚类的性能度量大致有两类: 外部指标:将聚类结果与某个参考模型...原创 2020-04-21 17:54:54 · 498 阅读 · 0 评论 -
【西瓜书阅读笔记】第8章 集成学习
第8章 集成学习8.1 个体与集成8.2 Boosting8.3 Bagging 与随机森林8.3.1 Bagging8.3.2 随机森林 8.1 个体与集成 集成学习:通过构建并结合多个学习器来完成学习任务(也称多分类器系统、基于委员会的学习) 同质集成:个体学习器(基学习器、基学习算法)类型相同 异质集成:个体学习器(组件学习器)由不同算法生成 对于分类问题,使用3个不同个体分类器,可以用投...原创 2020-04-18 22:34:53 · 473 阅读 · 0 评论 -
【西瓜书阅读笔记】第7章 贝叶斯分类器
第7章 贝叶斯分类器7.1 贝叶斯决策论7.2 极大似然估计二级目录三级目录 7.1 贝叶斯决策论 在概率框架下决策 下面以多分类为例 期望损失(或称为风险): 判定准则:最小化总体风险 贝叶斯判定准则:为最小化总体风险,只需在每个样本上选择哪个能使条件风险最小的类别标记 贝叶斯最优分类器: 贝叶斯风险: 想要用贝叶斯判定准则来最小化决策风险,首先要获得后验概率。 由于后验概率实际上难以获取,机器...原创 2020-04-15 02:26:31 · 816 阅读 · 0 评论 -
【西瓜书阅读笔记】第三章 决策树
第三章 决策树4.1 基本流程4.2 划分选择4.2.1 信息增益4.2.2 增益率4.2.3 基尼指数4.3 剪枝处理4.3.1 预剪枝4.3.2 后剪枝4.4 连续与缺失值4.4.1 连续值处理4.4.2 缺失值处理(跳过)4.5 多变量决策树 4.1 基本流程 创建树对数据进行分类(或者回归)。 根结点,内部结点(属性测试),叶结点(决策的结果) 4.2 划分选择 关键:如何划分(希望结点的...原创 2020-04-13 23:00:53 · 434 阅读 · 0 评论