分类问题的数学定义

本文探讨了机器学习中的分类问题,将其与决策问题进行对比,指出分类问题通常涉及有限预定义类别,而决策问题策略可能无限。分类问题的本质是构建函数将连续变量转化为离散变量,通常通过组合二分类问题来解决。文章还定义了分类函数和分类器,并讨论了实验错误概率与真正错误概率的关系。
摘要由CSDN通过智能技术生成

机器学习的任务大概可以分为分类和决策两类。当然,这两类问题并没有严格的界限。许多决策问题本质也是在分类。因为所谓决策,是根据当前的环境(输入),筛选出最优的策略。这个最优的策略可以看做是环境输入的类别。但是,决策问题与传统的分类问题不同。1. 通常分类问题预定的类别是有限个,而决策问题的策略集合可能无限。2. 一个输入的类别通常是确定的(即一个输入对应一个类别),可是在决策问题中,一个环境输入对应的策略可能是非确定的(即博弈论中所谓的混合策略)。

一个传统的分类问题,其本质是构造一个函数,将连续型变量映射成离散型变量。具体定义如下。

假设 D 是实例空间 X 上的一个概率分布。 S 是我们从实例空间中抽取出的训练集。训练集 S 中的每个实例都以概率分布 D 从实例空间 X 中取得。确切的说,训练集 S 被选中的概率满足

Pr{S}=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值