机器学习(一)线性模型

什么是机器学习?

机器学习是一门致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中“经验”通常以“数据”形式存在,因此机器学习研究的内容是关于从数据中产生模型的算法,有了这些算法,我们把数据提供给它,它就能基于数据产生模型,在面对新的情况时,模型会给我们提供相应的判断。什么是学习?赫尔伯特西蒙曾给出如下定义:“如果一个系统能够通过执行某个过程改进它的性能,这就是学习”

机器学习组成

主要任务
- 分类:将实例数据划分到合适的类别中。
- 回归:主要用于预测数值型数据。

学习方式
- 监督学习
必须确定目标变量的值,以便机器学习算法可以发现特征和目标变量之间的关系。 (包括:分类和回归)
样本集:训练数据 + 测试数据
训练样本 = 特征(feature) + 目标变量(label: 分类-离散值/回归-连续值)
特征通常是训练样本集的列,它们是独立测量得到的。
目标变量: 目标变量是机器学习预测算法的测试结果。
在分类算法中目标变量的类型通常是标称型(如:真与假),而在回归算法中通常是连续型(如:1~100)。
- 非监督学习
数据没有类别信息,也不会给定目标值。
聚类:在无监督学习中,将数据集分成由类似的对象组成多个类的过程称为聚类。
密度估计:将寻找描述数据统计值的过程称之为密度估计。
此外,无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。

线性回归模型

在统计学中,线性回归方程是利用最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

回归模型能用来干什么?

回归模型能用来预测数据,简单来说就是根据现有数据,预测接下来会出现什么数据。例如根据给定大量现有房屋价格,预测一套房屋的价格。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值