统计机器学习原理

机器学习原理


内涵

机器学习就是让计算机不再只会通过命令执行任务。

过程

定义解决问题的一套方法。简单来说叫做算法,复杂来说叫做模型。通常,机器学习方法都是复杂模型,即使是最简单的一元线性回归都是有很多个算法结构组成,所以机器学习第一步是构建模型。
已经明白其实模型就是更大规模的算法。这一步骤虽然是传统计算机能做的但是唯一不同的是,它打破了之前的瓶颈,有了自学习的性质。所以模型本质依然是算法。
如何理解这句话?也就是说机器学习模型学习的是它自身模型的参数。所以,目标就明确了,那就是要找到一系列模型参数的一个组合使得更加接近原始数据的同时又能反映未来结果。如果能以一个较高的预测效果去反映未来就说明找到了这样一个近似的规律。
它是如何自学习的?这是对于初学者来说是一个非常重要的问题!
就是利用了一种改进和迭代的思维。以损失或代价函数为基准去迭代参数,这是我们机器学习努力的方向——真实与历史更接近即损失损失代价函数更小。通过优化函数去优化和迭代,这是对于更新方式而言的。
要找到一种近似的客观规律需要一个学习策略。我们知道,世界的规律无处不在。每天你起床、吃饭、上班、上学的时间段。对于你来说,它就是一个规律。(当然,有时候并不规律,这会让结果难以预测。但总体来说,依然是有一个相对的规律,也就是说,这一个月,你可能有几天不在中午吃午饭,某个时间段不上班,但也只是几点,大部分日子还是会在那个时间段进行相应的任务。)机器学习要做的事情就是上个月的时间来预测你下个月可能完成日常事务的时间段。计算机要找到这种规律会怎么做,如果没有机器学习,那就必须用你的经验去告诉它,下个月我的平均起床时间、吃饭时间等等。通过if then等命令行指令来做一些任务。这就启示我们,要让机器自学习,首先要让它学会我们的思维。初始的机器学习学习的就是最简单的模仿不断重复就掌握了一件事这么一种学习思维。
我们设置一种模型让它通过对历史数据迭代不断靠近真实数据,生成一个似乎能够反映历史又能反映未来的一个结果。我们知道模型就是算法,少不了的是输入和输出,我们输入是原始的数据,输出是带有n个参数的模型。也就是说机器学习模型的输出并不是一个值或者一系列值。换句话说,机器学习模型的输出是它本身!你可能会问,模型不早就定义出来了吗?问题的答案是,模型的参数变了,通过优化迭代的方式改变,所以,模型变了的意思并不是模型框架改变而是参数组合发生变了,为了适应我们的预期(损失代价函数最小)。如此一来,就生成了一个我们需要预测的模型,这么一个过程叫做模型训练。就像你具备骑自行车的能力和条件,不断在尝试(更新策略),让自己每次摔倒更轻或则不摔倒(代价损失最小化),最终损失最小了,不能再小了以你现在的能力和条件水平,就停止学习,相对而言的你学会了骑自行车。我们就说,你这个‘模型’训练结束了,可以使用这项技能并且你可以从此骑自行车上学和上班了。
然而,你可以实现对未来骑车过程不会摔倒的预测了吗?准确率高你才敢去人潮拥挤和车流纵横的地方吧。所以,常常需要将原始数据进行分组用以评估和验证模型。
以上是机器学习基本原理,欢迎指正。
后续,将整理线性回归学习模型、神经网络学习模型、深度学习模型。


Thanks for reading

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值