机器学习入门-2:定义

来源:https://www.cnblogs.com/subconscious/p/4107357.html
从广义上来说,机器学习是一种赋予机器学习的能力,依此让它完成直接编程无法完成的功能的方法。
但是从实践的意义来说,机器学习是一种通过利用数据,训练处模型,再使用模型预测的一种方法。

拿国民话题的房子来说,现在我要卖一栋房子,售价多少?房子的面积是100平米,价格是100万,120万还是140万?
很显然,我希望获得房价与面积的某种规律。那么我该如何获得这个规律?用报纸或网上的平均数据?参考别人面积相似的?无论哪种,都不靠谱!
我现在希望获得一个合理的,并且能够最大程度地反应面积与房价关系的规律。于是我调查了周边与我房型类似的一些房子,获得一组数据。我希望从这组数据中找到面积和价格的关系,最终得到我房子的准确售价。
对该规律的寻找,很简单。拟合出一条直线,让它“穿过”所有的点,并且与各个点的距离尽可能小。通过这条直线,我获得了一个能够最佳反应房价与面积的规律,如下函数:
房价=面积*a+b
假设a=0.75,b=50,则房价=100*0.75=125万,这个结果与我前面所列的100万、120万、140万都不一样。由于这条直线综合了大部分的情况,因此,从“统计”的角度来说,125万是个最合理的预测。

在求解过程中,透漏出了2个信息:
1.房价模型是根据拟合的函数类型决定的。如果是直线,那么拟合出的就是直线方程。如果是其他类型的线,如抛物线,那么拟合出的就是抛物线方程。机器学习有众多算法,一些强力算法可以拟合出复杂的非线性模型,用来反映一些不是直线所能表达的情况。
2.如果我的数据越多,我的模型就能考虑越多的情况,由此对新情况的预测效果可能就更好。这就是机器学习界“数据为王”思想的一个体现。一般来说(不是绝对),数据越多,最后机器学习生成的模型预测的效果就越好。

机器学习的过程:
(1)在计算机存储历史的数据;
(2)通过计算机算法处理数据,即“训练”,处理的结果就是模型;
(3)使用模型对新数据进行预测,即“预测”;
“训练”与“预测”是机器学习的两个过程。“模型”是“训练”的中间输出结果。“训练”产生“模型”,“模型”指导“预测”。
这里写图片描述
人类对“经验”进行“归纳”,获得了生活的“规律”。当人们遇到新问题或对未来进行“推测”时,就会利用这些“规律”,为新问题与未来进行“预测”。
从上图可以发现,机器学习中的“训练”与“预测”可以对应到人类的“归纳”和“预测”。通过对比,可以发现,机器学习的思想并不复杂,仅仅是对人类在生活中成长的一个模拟。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值