最近人工智能方面最重要的发展之一就是机器学习了。它主要着眼于智能,而不是传统计算机程序意义上指定机器做什么东西,也就是说机器自己可以学习,这样它就可以直接从经验(或者数据)中学会如何处理复杂的任务。
即使是很简单的机器学习算法也能区分照片上的猫和狗
伴随着计算机速度的提高和算法的进步,机器学习的发展也非常迅速。从中衍生的算法已经对我们的生活造成了深刻的影响,而且有时候比人类做得更好。那么问题来了,机器学习到底是如何工作的?
从经验中学习
在一个机器学习系统中,计算机通过自己给自己编代码来完成一个任务,它一般是由基于这个任务的大量的数据来训练的。其中很大一部分涉及识别这些任务中的模式,然后根据这些模式做出决策。举一个(有点吓人)的例子,假设你的公司想要招聘一个新员工。你做了广告,然后有1000个人想来应聘,他们每个人都发了一份简历。你需要筛选这些简历,但是1000份简历也太多了吧,所以你就想训练一个机器来做这件事。
为了保证这件事有一定的可行性,假设你有以前招聘时收到的简历。每一份简历都有被录用或没有被录用的记录。你把这些简历的一半用来训练机器,让它发现这些简历是否被成功录用的模式。因此,如果你给机器一份简历,它就能知道这份简历是否可以被录用。训练完机器,你用另一半的简历来做测试。假设成功率很高,你就会相信机器可以胜任筛选简历的工作了。在上述的每一个阶段,都没有人的干预。这样的一个过程,以现在的计算机的能力是完全可以做到的。
基本要点
为了让机器学习的过程更加透明化,我们用开发可识别手写数字的机器的非常具体的例子来考虑模式识别的问题。这样的机器应该能够做到:不管一个手写的数字写得怎么样,它都能识别出来。