地统计之数据分布探索

昨天讲了对数据预处理的一个最简单的方法,利用数据分级进行异常值查询,这只是数据探索的第一步,而实际地统计分析前期数据的探索光去除异常值远远不够,还需要对数据的分布进行检查,探索全局异常值和局部异常值,了解全局趋势和局部变化,进而检查空间自相关(这一步对于克里金插值方法的选择至关重要)。今天我们的专题就是对定量数据分布探索。

Tips:不是所有的插值方法都要求数据服从正态分布,但以下方法要求数据必须服从正态分布,普通克里金、简单克里金和泛克里金法创建分位数图和概率图,如果数据本身不是正态分布,想要使用上述方法,必须通过某种变换使数据服从正态分布。直方图和正态QQ图可帮助检查数据是否服从正态变换。

步骤:地统计分析工具条→探索数据→直方图或正态图
在这里插入图片描述
由上图可以看出直方图由两部分内容组成,频率分布和汇总统计数据。频率分布为条形图显示的内容,用来显示观察值位于特定区间或组之内的频率。汇总统计数据的内容:平均值:数据的算数平均值;标准差:用来表征离散度,值越小,说明数据聚类相对于均值越紧密;偏度:用来表征分布对称度的测量值。对于对称的分布,偏度系数为零。如果分布具有较长的大值右尾部,则为正偏分布;如果分布具有较长的小值左尾部,则为负偏分布。对于正偏分布,平均值大于中间值;对负偏分布,平均值小于中间值。下图显示了一个正偏分布

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
DP-EMED(Data Pre-processing and Exploration with Model Explanations and Diagnostics)是一个数据准备和探索框架,可以帮助数据科学家处理和分析数据数据准备是指在进行数据分析之前,对原始数据进行清洗、转换和整理的过程。DP-EMED提供了多种功能来处理数据准备的任务。首先,它可以帮助用户发现和处理缺失值、异常值和重复值。通过使用统计方法和数据可视化工具,用户可以找出数据中的问题并进行相应的处理,以确保数据的质量。其次,DP-EMED还提供了数据转换的功能,可以将数据从一种形式转换为另一种形式。例如,可以对数据进行标准化、归一化、独热编码等操作,以便更好地适应模型的要求数据探索是指通过可视化和统计分析方法,对数据进行探索,从中发现有用的信息和模式。DP-EMED提供了各种功能来帮助用户进行数据探索。首先,它可以帮助用户可视化数据,通过绘制直方图、散点图、箱线图等图表,用户可以直观地了解数据的分布和关系。其次,DP-EMED还提供了统计分析的功能,可以计算数据的各种统计指标,如均值、方差、相关系数等,以更深入地理解数据的特征。此外,DP-EMED还提供了机器学习模型的解释和诊断功能,可以帮助用户理解模型的预测结果,并识别潜在的问题和偏差。 总之,DP-EMED是一个功能强大的数据准备和探索框架,通过提供多种功能和工具,帮助数据科学家更好地处理和分析数据,发现有用的信息和模式。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值