数据预处理
文章平均质量分 79
qq_43202474
这个作者很懒,什么都没留下…
展开
-
数据预处理——异常值查找与剔除
数据预处理——异常值查找与剔除1、3σ\sigmaσ法3σ准则是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理,它是以测量次数充分大为前提(样本>10),当测量次数少的情形用准则剔除粗大误差是不够可靠的。3σ法则为:数值分布在(μ-σ,μ+σ)中的概率为0.6827数值分布在(μ-2σ,μ+2σ)中的原创 2020-10-19 20:40:17 · 21559 阅读 · 2 评论 -
数据预处理——无量纲化处理
数据预处理——无量纲化处理1.无量纲化定义 无量纲化,也称为数据的规范化,是指不同指标之间由于存在量纲不同致其不具可比性,故首先需将指标进行无量纲化,消除量纲影响后再进行接下来的分析。2.无量纲化方法 无量纲化方法有很多,但是从几何角度来说可以分为:直线型、折线型、曲线形无量纲化方法。(1)直线型无量纲化方法 直线型无量纲化方法是指指标原始值原创 2020-10-15 20:18:20 · 31209 阅读 · 1 评论