pandas基本操作
数据链接
链接:https://pan.baidu.com/s/1WvfKRvCU9QdYWafrK8y1HQ
提取码:9ghd
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#jupyter notebook一定运行这一行代码,在cell中显示图形
data = np.read_excel(./qunar.xlsl)
查看数据
data.shape #查看数据形状
data.sum()
data.describe() #描述统计 中位数,平均数....
data.describe().T #
data.columns #列
datahead(10) #前十列
简单处理数据
col[0].strip() #第一列的列名去除前后的空格、
[x.strip() for x in col] #去除所有列名的空格
data.duplicataed().sum() #查看重复值的总数
data[data.suplicated()] #查看重复的记录
data.drop_duplicates(inplace=True) #删除表中的重复值 inplace=True 代表直接在源数据上进行操作
异常值处理,先找出异常值
data.describe().T
sta=(df['价格']-df['价格']