Python:启程 数据分析-牛客网在线编程-数据清洗+json处理-24-28

这篇博客主要介绍了Python在数据清洗方面的方法,包括去除信息不全的用户、修补缺失数据、处理用户重复数据、统一日期格式,以及将JSON文件转化为表格形式。在数据处理过程中,提到了dropna()函数的使用,并强调了在不同步骤中对dtype的设定要求。
摘要由CSDN通过智能技术生成

DA24 去掉信息不全的用户

注意:

1.不输入参数dtype=object 就通过不了。

2.

pd.set_option('display.width', 300)  # 设置字符显示宽度

pd.set_option('display.max_rows', None)  # 设置显示最大行

pd.set_option('display.max_columns', None)

为什么没有这3行就不能通过

3.dropna()用法:

DataFrme.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False)
参数:
axis: 默认axis=0。0为按行删除,1为按列删除
how: 默认 ‘any’。 ‘any’指带缺失值的所有行/列; 'all’指清除一整行/列都是缺失值的行/列
thresh: int,保留含有int个非nan值的行
subset: 删除特定列中包含缺失值的行或列

inplace: 默认False,即筛选后的数据存为副本,True表示直接在原数据上更改

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv', sep=',',dtype=object)
pd.set_option('display.width', 300)  # 设置字符显示宽度
pd.set_option('display.max_rows', None)  # 设置显示最大行
pd.set_option('display.max_columns', None)
# print(Nowcoder
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值