机器学习任务攻略

机器学习任务攻略

1. 出现误差的原因

1.1 model bias

  • The model is too simple.
  • Solution:redesign your model to make it more flexible.

请添加图片描述

1.2 optimization issue

  • 局部最优解
    在这里插入图片描述从Testing data上来看,56层的表现不如20层,不是过拟合。检查一下训练资料上的结果,20层和56层对比,56层弹性应该比20层的大,但是表现的却不好,不是模型偏差,而是56层的optimization没有处理好 。
  • Gaining the insights from camparison.
  • Start from shallower networks(or other models), which are easier to
    optimize.
  • If deeper networks do not obtain smaller loss on training data, then
    there is optimization issue.
    在这里插入图片描述
    上面数据中,5层的loss比4层的大,是不科学的,因此是optimization的问题。
  • Solution:more powerful optimization technology

1.3 overfitting

small loss on training data, large loss on testing data.
An extreme example
如果x存在于训练集,就输出他的标签,否则输出一个随机数。
在这里插入图片描述
更加灵活的模型会导致过拟合的出现。在这里插入图片描述

解决办法

  • 增加训练资料
  • data augmentation(数据加强)
    根据对数据的理解,增加资料。将图片资料翻转,截取其中一部分。注意不要上下翻转(不符合常理,可能会使机器感到奇怪。)
  • 对模型增加限制,不要让他过于灵活。
    less parameters, sharing parameters.减少参数,如果是深度学习,就减少神经元的个数。
    less features 例如,用前三天的资料预测明天,可以减少为用前两天的资料来预测明天。
    early stopping
    regularization
    dropout

在这里插入图片描述

1.4 mismatch

training and testing data have different distributions.
在这里插入图片描述

2.训练集和测试集的划分

  • 随机
  • N-fold Cross validation
    在这里插入图片描述

训练集:学习样本数据集,通过匹配一些参数建立一个分类器,主要是用来训练模型的。
验证集:对学习出来的模型,调整超参数。
测试集:测试集训练 ,好的模型的准确率

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
除了分类任务机器学习还包括以下任务: 1. 回归:回归任务用于预测连续型变量的值。与分类任务不同,回归任务的输出是一个连续的数值而不是离散的类别。例如,预测房屋价格、股票价格等。 2. 聚类:聚类任务用于将数据集中的样本划分为不同的组或簇,使得同一组内的样本更加相似而不同组间的样本差异较大。聚类算法帮助我们发现数据中的隐藏模式和结构,例如市场细分、用户分群等。 3. 降维:降维任务旨在减少数据集的维度,同时尽可能地保留原始数据中的重要信息。通过降维,可以减少计算复杂度、去除冗余特征、可视化高维数据等。常见的降维方法包括主成分分析(PCA)和线性判别分析(LDA)等。 4. 异常检测:异常检测任务用于识别数据集中的异常或异常行为。它有助于发现数据中的异常点、异常事件或潜在的欺诈行为。异常检测在金融领域、网络安全和故障检测等领域具有重要应用。 5. 强化学习:强化学习是一种通过代理与环境互动来学习最优行为的机器学习任务。代理通过与环境的交互来学习动作和环境之间的关系,并通过奖励和惩罚信号来优化其行为。强化学习在游戏、机器人控制、自动驾驶等领域有广泛应用。 这些任务代表了机器学习的一小部分,还有其他任务如推荐系统、文本分类、时间序列分析等。机器学习的目标是通过训练算法从数据中学习模式和规律,并用于预测、分类、优化等各种应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值