![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习笔记-《机器学习,周志华》
Clark_Kent125
这个作者很懒,什么都没留下…
展开
-
2.2
2.2 评估方法泛化误差:通过测试误差(testing error)近似(测试样本尽量不要出现在测试集中)如何从数据集中产生训练集和测试集?1.留出法将数据集分成两个互斥的集合*划分要尽可能保持数据分布的一致性,若从采样的角度看待数据的划分过程,则保留类别比例的采样方式通常称为分层采样。例如:数据集一半好一半坏,则测试集也一半好一半坏*单次使用留出法得到的估计结果往往不够稳定可靠,一般采用若干次随...原创 2018-03-07 10:50:26 · 185 阅读 · 0 评论 -
1.1,1.2
1.1 引言机器学习所研究的主要内容:从数据产生“模型”的算法1.2 基本术语数据集(data set):一批关于西瓜的数据示例(instance)/样本(sample):一个西瓜的描述特征(feature)/属性(attribute):西瓜的色泽...特征值/属性值(value):西瓜的色泽=青绿色样本空间/输入空间:西瓜的“色泽”“根蒂”“敲声”构成了描述西瓜的三维空间特征向量:每个西瓜对应样...原创 2018-02-15 20:46:07 · 264 阅读 · 0 评论 -
1.3,1.4
1.3 假设空间归纳(induction):一般到特殊演绎(deduction):特殊到一般概念学习:布尔概念学习:是或不是假设空间(hypothesis)版本空间(version space):假设空间的子集,符合训练集的所有假设 1. 4 归纳偏好Occam’s razor:若有多个假设与观察一致,则选最简单的算法的归纳偏好要与问题匹配No free lunch theorem:基于所有问题同...原创 2018-02-16 15:02:24 · 143 阅读 · 0 评论 -
1.5,1.6,1.7
1.5 发展历程仅具有逻辑推理能力远远实现不了人工智能。机器拥有知识。专家系统:由人把知识总结出来,再交给计算机是十分困难的。符号主义:ILP(inductive logic programming)连接主义:神经网络BP算法统计学习:支持向量机 1.6 应用现状大数据时代 1.7 阅读材料...原创 2018-02-17 11:10:14 · 196 阅读 · 0 评论 -
2.3
原创 2018-03-13 16:55:32 · 164 阅读 · 0 评论 -
2.1
2.1错误率(error rate):分类错误的样本数占总体的样本数精度(accuracy):1-错误率误差(error):预测输出与样本真实的输出产生的误差误差分为训练误差(training error)(empirical error)和泛化误差(generalization error)过拟合(overfitting):·学习能力过于强大,学到了不太一般的特性·若过拟合可以完全避免,则构造性...原创 2018-03-06 16:22:53 · 167 阅读 · 0 评论