使用python进行数据清洗

在数据清洗过程中,首先要通过`info()`、`shape`、`head()`和`describe()`等函数了解数据概况。`info()`展示数据总体情况,`shape`获取矩阵的行和列数,`head()`显示数据的前几行,而`describe()`提供数据的描述性统计量。了解数据后,可以使用`drop()`函数删除不必要的变量或字段。
摘要由CSDN通过智能技术生成

1、在数据清洗前,我们需要先查看数据概况,了解我们需要清洗的数据大概包含什么字段、每个字段下面数据范围大概如何,数据清洗常用到的函数和语法分别有:

info函数:用于了解数据总体情况,包括行数,列数,各列名称等,比如

app.info()

shape函数:用于查看数据矩阵的行和列 

关于python函数中shape的解释:
shape包含在numpy库,是矩阵(ndarray)的属性,可以获取矩阵的形状(例如二维数组的行列),获取的结果是一个元组,因此相关代码如下:
import numpy as np
x = np.array([[1,2,3,4,5],[6,7,8,9,10],[10,9,8,7,6],[5,4,3]])
#输出数组的行和列数
print x.shape #结果: (4, 5)
#只输出行数
print x.shape[0] #结果: 4
#只输出列数
print x.shape[1] #结果: 5
————————————————
版权声明:本文为CSDN博主「企鹅爱吃冰淇淋」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值