Hello, CSDN 上的小伙伴们好呀,因为研究生开始就要跟随导师研究关于
图像处理等方向的内容(本人今年已保研到电子科技大学,嘻嘻),所以趁
着大四寒假的空闲时间,准备好好将机器学习、深度学习学一下,做几个小
项目实战。这也是我在CSDN上发布的第二篇,后面会出来“西瓜书”的续集
哦!
所以,打算将学习笔记整理和大家共享,也欢迎大家交流学习,也欢迎大家
提出意见和建议!
西瓜书第一章的内容比较简单,主要是一些概念。
1.数据集:
进行机器学习之前,首先要有数据。记为:
该公式表示:包含m个示例的数据集。例:(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=浅白;根蒂=硬挺;敲声=清脆),…,即:属性=属性值。
每个属性作为一个坐标轴,则一个示例称为一个“特征向量”。
2.
从数据中学得模型(西瓜书中有时将 模型 称为 学习器)的过程“学习”or“训练”。
预测:
需要标记(label):((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜),“好瓜”=标签,
判断“好瓜”“坏瓜”用到回归分类,有二分类和多分类问题,模式识别中多出现这种。
测试:
学得模型之后,进行预测即测试。
3.
根据训练数据是否拥有标记信息,学习可划分为两大类:监督学习(supervised learning),(分类、回归等)和无监督学习(unsupervised learning),(聚类等),or称为“有导师学习”和“无导师学习”。
4.泛化能力:
学得的模型适用于新样本的能力。具有强泛化能力的模型能很好地适用于整个样本空间。
5.归纳(induction):
特殊到一般的“泛化”(generalization)过程。演绎(deduction):一般到特殊的“特化”(specialization)过程。
6.归纳偏好:
一个有效的机器学习算法必有其归纳偏好,否则将被其他等效假设迷惑,得不到确定的结果。
“奥卡姆剃刀”(Occam’s razor):若有多个假设与观察一致,则选择最简单的那个。