这篇文章主要对机器学习的基本概念和分类做一下总结。
文章目录
什么是机器学习
机器学习是一门通过编程让计算机从数据中进行学习的科学(和艺术)。
为什么使用机器学习
这里有两张图,描述处理问题时,传统方法和机器学习方法的过程和区别。
这是传统方法:
这是机器学习方法:
机器学习方法会通过训练数据来学习数据的规律或根据数据抽象出来模型,进而去解决新的问题。
机器学习可以通过数据来形成自适应改变,从而不需要人工干预了。
另外,机器学习可以帮助人类学习,通过对大量数据运行机器学习方法,可能会提醒到人类发现之前尚未发现的规律,从而收到启发,解决问题。
机器学习系统的类型
- 是否在人类监督下训练(有监督、无监督、半监督和强化学习)
- 是否可以动态地进行增量学习(在线学习和批量学习)
- 是简单的将新的数据点和已知的数据点进行匹配,还是向科学家那样,对训练数据进行模式检测然后建立一个预测模型(基于实例学习和基于模型的学习)
有监督学习和无监督学习
根据训练期间的监督数量和监督类型分类。
有监督学习
如用于垃圾邮件分类的已标记训练集如下,是一个有监督学习(数据带标签)。