机器学习之分类、回归、标注问题

本文详细介绍了机器学习中的三大问题类型:分类、回归和标注。分类问题涉及有限个离散结果,如文本和图片分类;回归问题关注连续输出,如股票预测;标注问题则涉及序列预测,如信息抽取。常见的评价指标包括精确率、召回率等,常用算法有k近邻、朴素贝叶斯、SVM、BP神经网络、隐马尔可夫模型等。
摘要由CSDN通过智能技术生成

机器学习的目的是为了解决实际问题。我们将实际问题分为三类:分类问题、回归问题、标注问题。
本文尽量以我的通俗语言描述:

1.分类问题

在机器学习算法中,很大一部分问题是分类问题,比如文本分类、图片分类、机械故障分类等等。
分类问题通常有有限个(离散)分类结果,机器学习到的目的就是为了训练分类器。
评价指标:
识别精确率、召回率
算法举例:
包括k 近邻法、感知机、朴素贝叶斯法、决策树、决策列表、逻辑斯谛回归模型、支持向量机、提升方法、贝叶斯网络、神经网络、Winnow 等

2.回归问题

回归问题的目的是为了得到输入到输出的函数。它与分类问题的最大区别是输出值是连续值。可以这样理解,他是一类建模问题,简单来说在曲线拟合中我们一般会有已知若干个点的坐标,然后近似的建模一条曲线尽量使这些点在曲线附近。这时我们拟合的是单一自变量x的曲线即f(x)是我们要得到的模型。
在更复杂的情况下如果一个点的自变量不只是x了而是x、x1、x2、x3…xn可能有n个自变量这时我们要得到f(x、x1、x2、x3…xn)这条曲线就适用于回归问题。
需要注意的是并非我们仅仅将它用在曲线拟合上,我们自变量不一定是横坐标点的概念。我们将上述的分类问题推广,将n个特征值作为自变量输出不是固定的几个分类而是不连续的值,就得到了回归问题。所以看吧,回归与分类的最大区别就是输出值是连续值。
典型问题是股票预测、辛烷浓度预测等等。

评价指标
平方损失函数,在此情况下,回归问题可以由著名的最小二乘法(least squares)求解

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值