认识数据从数据探索开始

本文介绍了数据探索的基础,重点关注数据集的中心趋势。讨论了如何处理倾斜数据和宽分布数据,提出了对数变换作为有效的方法来改善数据分布。
摘要由CSDN通过智能技术生成

数据探索简单学习


数据集中趋势:

1、平均数:
2、分位数:
(1)百分位数:
(2)四分位数:不受极端值影响。
(3)中位数:不受极端值影响。
3、众数:不受极端值影响。(数据量大有意义)

数据的离中趋势:
1、极差:max-min
2、分位距:Q3-Q1
3、平均差:sum(x-mean(x)) / n
4、方差标准差:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值