之杰的机器学习笔记:1.机器学习概述

                                                   

机器学习(Machine Learning)作为一门新兴的学科,已经逐渐渗透进我们的生活之中;迄今为止对于机器学习尚没有官方的定义,下面是两个关于机器学习的定义不妨作为参考:

第一个定义是由Authur Samuel提出的:他认为所谓机器学习是指不需要对计算机进行明确的设置的情况下使计算机拥有自主学习的能力(Field of study that gives computers the ability to learn without being explicitly programmed.)。我认为所谓机器学习即是赋予计算机能够像人类一样思考、学习的通用人工智能算法;不仅仅局限于像Alpha-GO那样通过大量的围棋棋局学习围棋的方法,事实上我们更致力于通过使机器人通过各种传感器捕捉实际信号,并能够复现人类的行为。想象一下你正在家里做家务,机器人通过观察你的动作便能够实现自主的做家务,这也是研究机器学习的科学家们不断探索的可能性。

                                                                                 

第二个定义则更加数学化,它是由Tom Mitchell提出的:计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。(A computer program is said to learn from experience E with respect to some task T and some performance measure P, if itsperformance on T, as measured by P, improves with experience E.)这个定义读起来也许会有些拗口,不过没关系,随着对这门课程的深入了解会对这个定义有更加深刻的认识。事实上,这个看似绕口令的定义非常简洁的概括了机器学习中计算机程序的思想。

                                                            

下面我们对机器学习进行更加细化的分类。一种通用的分类方法是把机器学习算法分成两类:监督学习和无监督学习。

所谓监督学习(Supervised Learning),是指给算法一个包括正确答案(或者说,标签)的数据集。也就是有一个老师时时刻刻辅导计算机进行学习。他会不断的告诉计算机哪些是正确的操作,哪些是错误的;这正像我们在义务教育中有过的经历:每一次考试都会有正确答案,我们通过吸取错题的经验不断进步,从而获得更高的分数。

所谓无监督学习(Unsupervised Learning),是指提供给计算机的数据不再带有标签。此时的计算机不再受老师的监督,是一种更加自主的学习方式。在这种算法中,我们往往会对计算机采取的一系列动作进行评分,或者去评估动作产生的价值;其目的也是使计算机获得更高的评分或产生更高的价值。

监督学习又可以分类为回归问题和分类问题,实际上这类似于解决连续性问题和离散性问题。

所谓回归问题(Regression),是指预测连续的数值输出。有一定实验经验的朋友很容易理解这个定义:设想我们成功采样了若干时刻对应的房价,通过分析我们可以认为这些参数服从一定的分布规律(例如,指数分布),那么我们便可以试图拟合出这种关系曲线,从而使计算机告诉我们任意时刻的房价大概是什么水平。事实上,我们对实验数据进行拟合处理时采取的正是这种思想。

所谓分类问题(Classification),是指预测离散值输出。一种常用的分类算法是聚类算法(Clustering algorithm),正如其名称,这个算法的目的是把得到的数据按照不用的特征分成不同的簇(cluster);设想这里有一大堆照片,每一张照片都是可爱的猫或狗。通过聚类算法计算机便可以很容易的区分哪些是猫,哪些是狗。另外当我们在淘宝上点击某款商品时,类似的商品便会出现在推荐商品中,这也是通过聚类实现的。

                                                                      

通过本文,读者应该能够对机器学习有初步的认识,逐渐建立机器学习的思想;应能够准确的对机器学习算法进行分类。从下一篇文章开始,我们将开始学习具体的机器学习算法。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值