数学建模2 数据预处理

注意

题目给出的数据不能直接使用,要对数据进行异常处理

缺失值

1.缺失值太多就要把该项指标删除(40%相当大)
2.处理:对精度不高
定量数据,使用均值
定性数据,使用众数
3.对数据精度有要求
但对导数没有要求,使用牛顿插值法
对导数有要求,使用样条插值法(飞机机翼,医学图像)
在这里插入图片描述

异常值

1.先找到异常值,再将其删去,用上面缺失值的方式补上
2.找异常值:正态分布(不适合排队论)
在正态分布中σ代表标准差,μ代表均值,x=μ即为图像的对称轴。
标准差
在这里插入图片描述
在这里插入图片描述

3.画箱型图(普遍适用)
1)从上到下,即数据从大到小
2)IQR越大,箱子越大,数据分散
3)在区间范围之外为异常值

在这里插入图片描述

  • 0
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在MATLAB中进行数学建模时,数据预处理是一个非常重要的步骤,它可以帮助我们清洗、转换和准备数据,以便后续的分析和建模。下面是一些常见的MATLAB数据预处理技术: 1. 数据清洗:数据清洗是指处理数据中的异常值缺失值和重复值等问题。在MATLAB中,可以使用函数如`isnan`、`isoutlier`和`unique`来检测和处理这些问题。 2. 数据转换:数据转换是指将原始数据转换为适合建模和分析的形式。常见的数据转换方法包括标准化、归一化、对数转换和平滑等。在MATLAB中,可以使用函数如`zscore`、`normalize`和`log`来进行这些转换。 3. 特征选择:特征选择是指从原始数据中选择最相关或最具有代表性的特征。在MATLAB中,可以使用特征选择算法如相关系数、方差分析和主成分分析等来进行特征选择。 4. 数据降维:数据降维是指将高维数据转换为低维表示,以减少数据的复杂性和存储空间。常见的数据降维方法包括主成分分析(PCA)和线性判别分析(LDA)。在MATLAB中,可以使用函数如`pca`和`lda`来进行数据降维。 5. 数据平衡:数据平衡是指处理不平衡数据集中类别不均衡的问题。在MATLAB中,可以使用函数如`undersample`和`oversample`来平衡数据集中的类别。 以上是MATLAB中常见的数据预处理技术,它们可以帮助我们提高数据的质量和准确性,从而更好地进行数学建模和分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DQ_CODING

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值