Q:什么是机器学习?
A:机器学习最初被定义为“不显式编程地赋予计算机能力的研究领域”。很明显,这里的“机器”是指计算机。
机器学习则不是直接告诉计算机什么时候做什么,而是提供一些案例(训练数据),让计算机通过案例自己学习,自己摸索什么时候应该做什么。一个著名的例子是给计算机输入一大堆“房价-房屋面积”数据,让计算机自己发现房价和房屋面积的规律,然后我们输入一个新的房屋面积数据,计算机就可以根据学习到的规律输出相应的房价。
机器学习的本质任务是预测。
“机器学习”同时也是一门学科,研究怎样使得计算机更好地学习,亦即,是一门研究“学习算法”的学科,主要任务是评估“学习算法”的好坏以及开发新的“学习算法”。这里的“学习算法”是计算机的学习方法,本质上是一种基于现有的数据产生预测模型的算法。
Q:学习一门学科需要先掌握其基本概念,“机器学习”领域有哪些需要掌握的重要概念?
假设我们希望用这一批数据来让计算机学习
1、样本、示例、记录——这批数据里的每对括号。
2、数据集——这组样本(示例、记录)的集合。
3、特征、属性——色泽、根蒂、敲声等反映一个事物的本质的可观察方面。
4、属性值——青旅、墨绿、蜷缩、浊响等,是属性的取值。
5、属性空间、样本空间、输入空间——属性张成的空间。这似乎是线性代数的语言,亦即把属性当作坐标轴,形成一个空间,那么样本就是这个空间中一个个的点。例如,吧“色泽”、“根蒂”、“敲声”作为坐标轴,则长生了一个三维空间,每个西瓜都是这个空间里的一个点。
6、维数——样本空间的坐标轴数,也就是数据集的特征数量。本例中的维数是3。
《机器学习》笔记(一)
最新推荐文章于 2022-07-25 20:16:13 发布