周志华机器学习
文章平均质量分 80
机器学习原理与代码
青年有志
【进化计算、群体智能、多目标优化、机器学习、深度学习】 仰望星空,脚踏实地~
展开
-
统计学中的Bootstrap方法(有放回的抽样)
Bootstrap又称自展法、自举法、自助法、靴带法 , 是统计学习中一种重采样(Resampling)技术,用来估计标准误差、置信区间和偏差Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。机器学习中的Bagging,AdaBoost等方法其实都蕴含了Bootstrap的思想,在集成学习的范畴里 Bootstrap直接派生出了Bagging模型.用子样本来类比总体我要统计鱼塘里面的鱼的条数,怎么统计呢?假设鱼塘总共有鱼1000条,我是开了上帝视角的,但是你是不知道里面有多少。原创 2023-05-21 14:48:51 · 3571 阅读 · 0 评论 -
第4章 决策树
1. 基本流程2. 划分选择2.1 信息增益2.2 增益率2.3 基尼系数3. 剪枝处理3.1 预剪枝3.2 后剪枝4. 连续与缺失值4.1 连续值处理4.2 缺失值处理5. 多变量决策树6. 阅读材料习题原创 2023-05-08 09:04:41 · 72 阅读 · 0 评论 -
第3章 线性模型
符号/名词说明线性模型(linear model)学得一个通过属性的线性组合来进行预测的函数非线性模型(nonlinear model)可在线性模型的基础上引入层级结构或高维映射得到可解释性(comprehensibility)、可理解性(understandability)线性回归(linear regression)试图学得一个线性模型以尽可能准确地预测实值输出标记序(order)均方误差、平方损失(square loss)欧式距离(Euclidean distance)原创 2023-05-06 20:26:47 · 156 阅读 · 0 评论 -
【理论 | 代码】机器学习分类与回归性能评估指标大全
MSEn1i1∑nwiyi−yi2nSSEwi为每个样本数据的权重系数,wi> 0, 通常为 1范围∞,当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。总而言之,值越小,机器学习网络模型越精确,相反,则越差。原创 2023-05-03 20:42:31 · 2315 阅读 · 0 评论 -
机器学习中的性能度量
Ef;D。原创 2023-05-01 18:03:07 · 149 阅读 · 0 评论 -
机器学习中的归纳偏好
算法本身的归纳偏置说明了对于不同的问题,算法的效果是不同的,所以算法需要针对特定的问题设计。原创 2023-04-24 22:01:43 · 74 阅读 · 0 评论 -
《机器学习》中的假设空间和版本空间
监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。我们也可以将学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索目标是找到与训练集"匹配"的假设,即能够将训练集中的瓜判断正确的假设。假设的表示一旦确定,假设空间及其规模大小就确定了。与训练集一致的“假设集合”。原创 2023-04-24 17:28:09 · 2735 阅读 · 3 评论 -
第 2 章 模型评估与选择
F1。原创 2023-04-04 21:44:28 · 68 阅读 · 0 评论 -
第1章 绪论
1. 引言2. 基本术语3. 假设空间4. 归纳偏好5. 发展历程6. 应用现状7. 阅读材料习题参考文献原创 2023-04-04 21:03:53 · 120 阅读 · 4 评论 -
第09章 聚类算法
第09章 聚类算法原创 2023-04-02 19:44:54 · 75 阅读 · 0 评论