1.机器学习基础概念:
数据:鸢尾花数据 给出
鸢尾花各项数据信息:花瓣,萼片等
首先我们完成机器学习的任务肯定手里面是有一组数据的。通常我们管我们手里的一组数据整体叫数据集。但你手里的数据和机器应用的数据可能是不一样的,是两个数据集。
注意:上图最后一列是我们的机器要学习出来的部分。也就是通过萼片花瓣等信息判断出来它的种类是否是鸢尾花。
而通常我们将萼片,花瓣等信息用一个X表示,如下图
而最后一列我们通常用y来表示。
矩阵中我们通常用大写字母表示矩阵,用小写字母表示向量。
我们用萼片的长度作为x轴,萼片的宽度作为y轴。
所以我们可以得知,我们判断给定的花究竟是哪一类化,本质上就是在这个特征空间进行的一个切分。
关于特征可能也有很多的说法,也许每一个像素点都是一个特征。如下图所示。
我们喂给机器的特征,是什么样子的,将很大程度的决定我们的算法最终计算出来的结果的准确性和可靠性。