机器学习之分类算法导论

        分类简单来讲就是确定对象属于哪个预定义的目标类。分类问题是一个普遍存在的问题,有许多不同的应用,

例如:垃圾邮件过滤,给网站文章分类,根据核磁共振扫描的结果区分肿瘤是恶性的还是良性的,根据树叶的形状

给分类,如图1:



       分类任务的输入数据是样本的集合,用元组(x, y)表示,其中x是属性(变量或特征)的集合,而y是一个特殊的属性,

表示样本属于哪个类别(也称分类属性或目标属性)。图2列出了一个数据集。属性(特征)值是离散的,但是也可以是连

续的。另外一个方面分类的目标属性值必须是离散的,这是区别分类与回归的关键特征。回归的y值即目标属性是连续的。


分类任务就是通过学习得到一个目标函数

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 当机器学习算法的目标变量是连续变量时,数据通常是由一组数值型变量组成的。这些变量可以是实数,也可以是整数,但通常是连续的。例如,如果我们正在预测房价,那么我们可能会收集一些与房价相关的变量,如房屋面积、卧室数量、浴室数量等,这些变量通常是连续的数值型变量。在这种情况下,我们的目标是预测一个连续的数值 - 即房价。 ### 回答2: 当机器学习算法的目标变量是连续变量时,我们所处理的数据通常是数值型的。这些数值可以是实数也可以是离散的数值。 连续变量是指在某个范围内可以取得无限个数值的变量。例如,房屋价格、温度、股票指数等。 在这种情况下,我们要使用的数据集通常由以下两部分构成: 1. 特征变量:用于描述和预测目标变量的一组特征。这些特征可以是连续变量、离散变量或者是二进制变量。例如,对于房屋价格的预测,特征变量可能包括房屋的面积、卧室数量、厨房数量等。 2. 目标变量:即我们要预测或者估计的变量,也就是连续变量。在所给的数据集中,目标变量是已经存在的,用于训练和验证模型。 在机器学习算法中,我们通常将数据集分为训练集和测试集。训练集用于训练模型,而测试集用于评估模型的性能。训练集和测试集的数据样本都包括特征变量和目标变量。 对于连续变量的数据,我们可以使用各种回归算法来进行建模和预测,如线性回归、决策树回归、支持向量回归等。这些算法会根据特征变量和目标变量之间的关系,学习出一个数学模型,以便在给定特征变量的情况下,预测目标变量的值。 ### 回答3: 当机器学习算法的目标变量是连续变量时,数据的样式通常是带有数值的连续数据。这意味着目标变量具有一定范围内的无限可能取值,而不是一组有限的离散值。 举例来说,假设我们正在使用机器学习算法预测房屋价格。在这种情况下,目标变量被定义为某个地点上房屋的准确售价。这个目标变量通常是一个连续变量,因为房屋的价格可以是小数或者任意数字值。 对于连续变量的数据,可以具体描述为一组数值的序列或者一个数值范围。在回归问题中,我们关注预测目标变量的具体数值,因此我们的数据通常是已知特征对应的目标变量的数值。例如,我们可以提取有关房屋的各种特征(如房屋面积、卧室数量、浴室数量等)和相应的房屋价格作为训练数据。 在进行连续变量的机器学习算法训练时,我们可能会使用一系列数学模型(如线性回归、决策树、神经网络等)来通过已有的特征数据来预测连续目标变量的值。这些算法使用统计学和优化方法来寻找特征与目标变量之间的关系和模式,以便在新的输入数据上进行预测与推断。 总之,当机器学习算法的目标变量是连续变量时,我们通常处理一组具有数值的连续数据,通过算法来预测或推断出目标变量的具体值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值