datawhale.1 数据探索性分析(EDA)

一、常用python库
  1. 数据科学库
    • numpy
    • pandas
    • scipy
  2. 可视化库
    • matplotlib
    • seabon
  3. 其他具体功能库
二、基本数据分析流程
  1. 载入数据,通过head方法和打印shape来大体上把握数据
  2. 数据概览
    • describe方法查看相关统计量
    • info方法总览数据类型
  3. 数据缺失和异常
    • 每种类型数据是否存在NaN
    • 注意异常值
  4. 了解预测值分布
    • 总体分布情况
    • 查看skewness和kurtosis
    • 查看预测值的具体频数
  5. 数字特征分析
    • 特征间相关性
    • 特征的skewness和kurtosis
    • 特征值分布可视化
    • 特征关系可视化
    • 多变量相互回归关系可视化
  6. 类型特征分析
    • 特征的unique分布
    • 特征可视化(箱型图、小提琴图)
    • 特征类别频数可视化(直方图)
  7. 综合性分析——pandas-profiling数据报告
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值