1.读取数据
import pandas as pd
df= pd.read_excel("data/销售数据.xlsx")
2.返回数据的行,列
df.shape
'''
(13739, 7)
'''
3.对每一列进行统计,返回是否为空值,数据类型等
df.info()
'''
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13739 entries, 0 to 13738
Data columns (total 7 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 订单日期 13739 non-null datetime64[ns]
1 门店城市 13739 non-null object
2 商品编号 13739 non-null int64
3 产品名称 13739 non-null object
4 销售数量 13739 non-null int64
5 零售价 13739 non-null int64
6 销售额 13739 non-null int64
dtypes: datetime64[ns](1), int64(4), object(2)
memory usage: 751.5+ KB
'''
4.描述性统计信息
df.describe()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/85b6efcac0499f982c3c80bab745d2fc.png)
5.查看前几条/后几条数据
df.head()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/bb3ff93d22323d783a6e4117d572a80d.png)
df.tail()
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4e7f92aac7388e9012d210706d242ae0.png)