1.什么是机器学习
刚刚接触人工智能时我感觉很神奇,但最近学习了一些内容后我发现,人工智能还是模拟人类
思考的过程,或者说是怎样获取知识并如何去表示知识。就比如以亚洲人来看,我们如何分辨
一个亚洲人是那个国家的人,就比如说
中国人下颌适中,日本人长脸长鼻,韩国人眼小颧高,泰国人肤色暗深,这是我们根据经验去
判断的,而如果我们去让计算机进行判断,那么计算机该如何进行判断呢。
我们可以这样思考,人根据经验,来自于书籍或者对话等各种方式获得的经验帮助我们进行
判断。这是一种从大量现象中提取反复出现的规律与模式,这也是人类学习的一种机制。
那么我们可以给计算机一个数据集,里面包含一些关于判断一个亚种人是那个国家的内容,
有了这些数据集,我们依靠学习算法,让我们的机器开始变的 ”有经验“,这种过程便叫做
训练。而这种学习的过程便可以称之为机器学习。
我们可以更专业一点:
机器学习要做的就是根据已有的训练数据推导出描述所有数据的模型,
并根据得出的模型实现对未知的测试数据的最优预测。
在机器学习中,数据也并不是通常意义上的数量值,而是对于对象某些性质的描述,被
描述的性质叫做属性,属性的取值称为属性值,不同的属性值有序排列得到的向量
就是数据,也叫实例。
2.监督学习
监督学习可以说是机器学习中最常见的一种机器学习的问题
假如我们有西安市王八村的一些房价与面积的一些数据,例如100平方米对应50万,那么
你的女朋友想跑路咨询你她手里的房子可以卖多少,例如她有一个120平米的房子。
好吧,那么关于这个问题,机器学习算法会帮助你什么呢
我们把已有的数据进行画图,可能是下面这样的
那么我们看看120对应的应该是110万左右,当然数据也都是我随便画的。
不过使用这种方法我们可以解决你的女朋友的问题,或者你应该换个女朋友
试试。
对于这个例子,我们拟合了一条直线,可能这不是最完美的拟合,但这给我们
解决问题提供了一种方法。
可以看出监督学习指的是我们给学习算法一个数据集,这个数据集由正确答案组成
,在上面的例子中,我们得到了一组实际出售房价的数据,然后运用学习算法算出更多
的答案,或者用术语讲,这是回归问题,我们试着推测出一个连续值的结果,即房子的
价格。
接下来将学习分类问题,我们将知道如何简单的预测肿瘤的程度。