作为数据分析的初学者,我感受最深的就是很多时候我想分析处理下数据,无从下手,有的代码也不记得,查找使用方法又得花费时间,所以我整理了一份数据分析问答形式的专题,这里都是平时实战中常用到的,方便以后直接利用!
嘿嘿,进入正题!上题目~
Q1:查看数据相关信息?
df.info()#查看数据类型
df.shape#查看数据规模
df.describe()#数据统计信息描述
Q2:如何设置才能不隐藏DataFram的列?
pd.set_option("max_columns",100)#这里100可以调整:最大显示列数
pd.set_option('display.max_columns',None)#这种是都显示
Q3:统计空值?
df.isnull().sum()
Q4:查看是否有重复值?
df.duplicated().any()
Q5:填充空值?
df.fillna(method="ffill")#这是前向方法填充,bfill为后向填充
df.fillna(0)#用0填充空值
Q6:删除列?
df.drop([""],axis=1,inplace=True)
Q7:删除有空值的行?
df.dropna(axis=0,how='any',inplace=True)
Q8:删除重复值?</