Python建模 --处理数据(一)

本文介绍了如何使用Python进行数据分析的基本步骤,包括数据维度查看、数据预览、描述性统计、属性类型检查、数据分组计数、皮尔逊相关系数计算以及数据分布的偏度分析(高斯分布)。
摘要由CSDN通过智能技术生成

 / 显示数据维度

print("数据维度:行 %s,列: %s" % dataset.shape)
# 意思是%作为一个替代,将后面的dataset.shape字符串的返回值分别加到"行","列"后面

  / 查看数据

#查看前几项
print(dataset.head(10))
#print(dataset.head())默认返回前5行
#查看尾部几项
print(dataset.tail(10))
#print(dataset.tail())默认返回后5行

  /描述性统计

print(dataset.describe())

 / 数据的属性和类型

print(dataset.dtypes)

 / 数据分布情况

print(dataset.groupby('class').size())
#groupby() --分组函数
#size() --元素个数

 /数据相关性  (皮尔逊相关系数)

print(dataset.corr(method='pearson'))

 

 /数据的分布分析 (高斯分布)

数据接近0 , 偏差最小

print(dataset.skew())

  • 7
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值