回归问题简介以及与分类问题的区别

机器学习中的回归和分类是什么?

数据科学家使用许多不同类型的机器学习算法来发现大数据中的模式,这些模式可带来切实可行的见解。 从较高的层次上讲,这些不同的算法可以根据它们“学习”数据进行预测的方式分为两类:监督学习和无监督学习。

有监督的机器学习:大多数实际的机器学习都使用有监督的学习。 在监督学习中,您具有输入变量(x)和输出变量(Y),并使用一种算法来学习从输入到输出的映射函数Y = f(X)。 目标是很好地近似映射函数,以便在拥有新的输入数据(x)时可以预测该数据的输出变量(Y)。

监督机器学习算法的技术包括线性和逻辑回归,多类分类,决策树和支持向量机。 有监督的学习要求用于训练算法的数据已被正确答案标记。 例如,分类算法将在经过训练的图像数据集上学会识别动物,该图像数据集已正确标记了动物的种类和某些识别特征。

监督学习问题可以进一步分为回归和分类问题。 这两个问题的目标都是构建一个简洁的模型,该模型可以根据属性变量来预测从属属性的值。 两项任务之间的区别在于,从属属性对于回归而言是数值的,而对于分类则是分类的。

回归

回归问题是当输出变量是实数或连续值时,例如“工资”或“权重”。 可以使用许多不同的模型,最简单的是线性回归。 它试图使数据适合通过这些点的最佳超平面。

举些例子:
以下哪项是回归任务?

预测一个人的年龄
预测一个人的国籍
预测公司的股价明天是否会上涨
预测文件是否与目击不明飞行物有关?

答案:预测一个人的年龄。

分类
分类问题是当输出变量是类别时,例如“红色”或“蓝色”或“疾病”和“没有疾病”。 分类模型试图从观测值得出一些结论。 给定一个或多个输入,分类模型将尝试预测一个或多个结果的价值。
例如,当过滤电子邮件为“垃圾邮件”或“非垃圾邮件”时,在查看交易数据时为“欺诈性”或“授权”。 简而言之,分类要么预测分类类别标签,要么根据训练集和分类属性中的值(分类标签)对数据分类(构建模型),并将其用于分类新数据。 有许多分类模型。 分类模型包括逻辑回归,决策树,随机森林,梯度提升树,多层感知器,朴素贝叶斯。

例如 :
以下哪个是分类问题?

通过他/她的笔迹样式预测一个人的性别

根据面积预测房价

预测明年的季风是否正常

预测下个月将出售音乐专辑的份数

答案:预测一个人的性别预测明年的季风是否正常。 另外两个是回归。

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值