程序员眼中的机器学习

前言

    目前机器学习的学习资料有很多,但大多偏理论。对于一个在职的程序员,早已把知识还给老师的人,会更希望知道,该怎么做才能完成老板交代的任务。这里从实战的角度介绍机器学习,希望对一些刚入坑的程序员有帮助。当然理论还是绝对必要的。

什么是机器学习

    这个概念非常宏大,但一句话总结,机器学习就是从已有的数据中学习到一个数学模型,这个模型通常就是一个函数f(x),然后将这个模型应用到实际的任务中。

    例如,你的老板给你了一群人的身高和体重,要求你开发一个通过身高预测体重的程序。传统的做法可能就是统计出身高和体重的映射表,然后通过一堆的if else 来预测。

    下面我们看看机器学习如何工作的,首先我们需要定义一个函数f(x)=y,这个函数就是我们的数学模型,x就是我们模型的输入也就是身高,y则是模型的输出也就是体重。那机器要学习什么呢?这个就需要看你如何定义f(x)。通常我们会让f(x)=wx+b,这是典型的线性模型,其中w、b便是机器要学习的参数。 当然这个模型也可以定义成任何你喜欢的形式,例如 : f(x)=w 1x+w 2x 2+w 3x 3+b 那么w 1、w 2、w 3、b 便是要学习的参数。

机器如何学习

    上面介绍了,机器学习的本质就是去学习一个函数f(x),那机器如何学习呢?

    通常机器学习首先需要做以下准备:

  • 收集训练数据,也就是机器学习的学习资料。
  • 定义模型也就是上面提到的f(x)=wx+b,相当于学生。
  • 定义目标函数,相当于老师,教会我们模型去学习最好的参数。

    什么是目标函数?让我们继续完成上面用身高预测体重的程序。

    我们有了一批x(身高)和y(体重)的数据,也定义了模型f(x)=wx+b,那怎样解出w和b呢?也许你可能想,我们把训练数据都带入到方程中,这样我们就得到一批关于w和b的方程,剩下的就是解一个二元一次方程。但真实情况这个方程可能是无解的,不可能刚好解出一个w和b能都满足我们的训练数据。这种情况我们就必须定义一个目标函数,来指导如何优化我们的模型得到最优的w和b。这里我们定义目标函数为 :

Loss=\sum_ {i=1}^n  (f(x)-y)^2

    这里的n是我们的训练数据总量。 我们通过最小化这个目标函数,最终要求我们的模型预测出来的身高和真实的身高y约接近越好。这样我们就学习到了一个很好的w和b。而这个最小化目标函数的过程,就是训练。通常我们使用梯度下降法来最小化目标函数。

训练好模型后,我们就可以把模型应用到我们的程序中了。

PS:     在有些文章你也会看到代价函数、损失函数,他们和目标函数有些细微的差别,但完全可以当做一个东西去理解,他们的作用也都是用来优化模型的。

    在训练的过程中我们的重点关注在目标函数,当模型训练好后,我们便把模型运用在具体的任务中。

    目标函数中总是会包含我们的模型,这样我们才能优化模型。

程序员为什么要学习机器学习

    目前机器学习已经应用到了生活的各个方面。例如新闻的推荐系统、语音识别、自然语言处理、无人驾驶、垃圾邮件、机器翻译等众多领域都有机器学习的影子。

    在编程上,其实有很多任务光凭规则,是没办法完成。例如让程序去识别一个树,让程序从一段话中抽出摘要。so,授之以鱼不如授之以渔,我们要教会电脑去钓鱼。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值