Series和DataFrame上手都很容易,但是深入理解一下还是有必要的——磨刀不误砍柴工嘛
import pandas as pd
我们以一个具体的例子来说明
df = pd.read_clipboard()
打开国家统计局网页,复制一个表格,然后读取粘贴板,easy
df
指标 | 地区 | 数据时间 | 数值 | 所属栏目 | 相关报表 | |
---|---|---|---|---|---|---|
0 | 居民消费价格指数(上月=100) | 全国 | 2019年10月 | 100.9 | 月度数据 | 相关报表 |
1 | 居民消费价格指数(上月=100) | 全国 | 2019年10月 | NaN | 月度数据 | 相关报表 |
2 | 居民消费价格指数(1978=100) | 全国 | 2018年 | 650.9 | 年度数据 | 相关报表 |
3 | 居民消费价格指数(1978=100) | 全国 | 2017年 | 637.5 | 年度数据 | 相关报表 |
4 | 居民消费价格指数(上年同月=100) | 全国 | 2019年10月 | 103.8 | 月度数据 | 相关报表 |
5 | 居民消费价格指数(上年同月=100) | 全国 | 2019年10月 | NaN | 月度数据 | 相关报表 |
6 | 居民消费价格指数(上年同期=100) | 全国 | 2019年10月 | 102.6 | 月度数据 | 相关报表 |
7 | 居民消费价格指数(上年同期=100) | 全国 | 2019年10月 | NaN | 月度数据 | 相关报表 |
8 | 居民消费价格指数(上年=100) | 全国 | 2018年 | 102.1 | 年度数据 | 相关报表 |
9 | 居民消费价格指数(上年=100) | 全国 | 2017年 | 101.6 | 年度数据 | 相关报表 |
10 | 城市居民消费价格指数(上年同月=100) | 全国 | 2019年10月 | 103.5 | 月度数据 | 相关报表 |
11 | 城市居民消费价格指数(上年同月=100) | 全国 | 2019年10月 | NaN | 月度数据 | 相关报表 |
空值对数据分析是没有意义的,我们先去掉
df1 = df.dropna(axis=0)
df1
指 |
---|