西瓜书机器学习笔记(一)

最新推荐文章于 2024-01-09 21:47:05 发布

俗人（俗不可耐）

最新推荐文章于 2024-01-09 21:47:05 发布

阅读量218

点赞数

文章标签：机器学习人工智能 python

本文链接：https://blog.csdn.net/ClownG/article/details/108600065

版权

本文是机器学习的学习笔记，介绍了模型评估方法，包括留出法、交叉验证法和自助采样法，并详细讲解了性能度量如查准率、查全率、混淆矩阵、F1度量、ROC曲线及其AUC值。

摘要由CSDN通过智能技术生成

记录学习机器学习的过程,方便自己以后查阅;

一.机器学习

机器学习是一门致力研究如何通过计算的手段,利用经验来改善系统自身的性能的学科;在计算机系统中,“”经验通常以“数据”形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生“模型”的算法,即“学习算法”(learning algorithm).通过经验数据可以基于数据产生模型.在面对新的数据时,可以提供相应的判断.

二.一些概念知识

用来训练模型的数据集叫做训练集,用来测试模型性能的数据集叫测试集或验证集.但是可能存在一个和训练集一致的“假设集合“,这个集合被称为”版本空间“.
通过模型学习数据所产生的算法,本身具有”偏好“.
”奥卡姆剃刀“是一种常用的自研科学研究的原则,若有多个假设与观察一致,则选择最简单的那个;
“没有免费的午餐”定理(No Free Lunch Theorem,简称NFL),对于一个学习算法a而言,若它在某些问题上比学习算法b好,则必然存在另一些问题,在那里b比a好.这个结论对任何算法成立.