【Python】展示表格中每列数据的统计特征-[自动化办公]

本文介绍了如何通过Python对表格数据进行统计分析,将列分为数字、分类和时间三类,并展示了各类别的统计信息,如记录数、非空值、空值占比等。同时,提出了改进方向,包括生成图表和优化代码重复性。
摘要由CSDN通过智能技术生成

实习产物。

要求:导入一张表格,内有很多列数据。需要将所有列分为三类:数字、分类、时间

1.连续字段,统计:记录数、非空记录数、空值数(NULL’’)、空值占比、去重记录数、最大值、最小值、均值、标准差、10-90&99分位数

2. 分类字段,统计:记录数、非空记录数、空值数(NULL、’’)、空值占比、去重记录数、每个分类的记录数即频度,记录数占比即频率

3.时间字段,统计:计算字段的最大日期,最小日期,by YYYYMM的记录数,生成柱状图

代码逻辑

分类逻辑

基本基于数据类型分类(可能需要在上游数据里先调好数据类型)

1.Time——数据类型为date; 此处只有datetime64[ns],如有不同可在include里删改

2.Categorial——数据类型为object∪(去重纪录数<=0.05*记录数) (有时会用不同数字代表不同情况ÿ

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值