机器学习问题的简单介绍

对于一个完整的机器学习问题,一般包括以下五个部分:

样本      模型      训练      测试      推理

样本是去抽取知识的依据。机器学习并不是盲目的进行推理,通常会根据已知的内容来抽取一些客观的的规律,然后根据这些规律去进行进一步的推理和预测,而这些规律是通过样本挖掘出来的。样本通常包括两个部分:属性和标签。属性可以理解为是对样本的描述,比如,对于一个“人”,他的皮肤是黄色的,眼睛是黑色的,另外一个“人”的皮肤是白色的,眼睛是蓝色的,通过不同颜色皮肤和眼睛这样的属性来描述这个人,而标签则是指带有这种属性的人是黄种人还是白种人,这里的黄种人、白种人就是对应样本的类别。标签可以是离散的值,也可以是连续的值。对于一个样本而言,它的属性描述了样本本身的一些性质,标签则是对这个样本的归类。而对于一个函数:

y = f\left ( x \right )

这个函数的输入是x,输出是y。属性就是其中的x,标签则是y。若已知x和y,则可以对x和y进行建模。这里的模型其实指的就是f这个函数,用来描述x与y之间的关系。训练指的就是从样本中学习得到这个模型的过程。比如:

f(x) = ax + b

训练的过程其实就是求a和b的过程。通过训练的方法可以获取模型的参数,有了参数后,就可以对当前的这个模型进行测试和评价。测试的过程其实就是评价模型的过程。比如通过一种机器学习的算法获取到了一组模型参数,此时并不知道有没有其它方法求解出来的模型比当前的模型预测出来的效果要好,要想知道模型的好坏则需要通过一套测试的方法来评价这个模型。通过测试能够完成对一个模型性能的评估,如果性能还不错,我们就得到了f(x)这个函数。此时,拿到一组只有属性而没有标签的样本,我们就可以通过f(x)这个函数对当前样本进行预测,获取到这个样本的标签。其中,预测的过程就是获取标签的过程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值