实战4
读取 population_data.json 数据统计以下5个国家2010年人口的占比情况。
country_list = [“Afghanistan”,“Albania”,“Arab World”,“Aruba”,“Bangladesh”]
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_json("population_data.json")
df.info()
df.head()
"""
- 时间:Year
- 国家:Country Name
- 人口数量:Value
"""
"""
透视表
- 列索引:时间:Year
- 行索引:国家:Country Name
- 值:人口数量:Value
"""
# pivot 实现透视表
popu_data = df.pivot_table(index="Country Name",columns="Year",values="Value")
popu_data
"""
实现取出对应国家2010年人口数据
- 选择数据
- 神奇索引
"""
country_list = ["Afghanistan","Albania","Arab World","Aruba","Bangladesh"]
country_data = popu_data.loc[country_list,2010]
country_data
"""
绘图
"""
country_data_list = country_data.values
country_data_list
plt.figure(figsize=(15,8))
plt.pie(country_data_list,labels=country_data.index,autopct="%1.2f%%")
plt.show()
实战5
需求:
• 以公司为行索引
• 时间为列索引
• 票面金额为值
• 最终将每月的数据保存到同一 .xls 文件中的不同 sheet中
最终实现效果:
df = pd.read_excel("合并1.xls")
df.info()
df.head()
"""
需求:
• 以公司为列索引
• 时间为行索引
• 票面金额为值
• 最终将每月的数据保存到同一 .xls 文件中的不同 sheet中
"""
# 生成透视表,并且index分组后指定聚合函数为np.sum
# aggfunc=np.sum 实现求和
df_pivot = pd.pivot_table(df,index="到期日/返售日",columns="额度占用人名称",values="票面金额",aggfunc=np.sum)
df_pivot.head()
&#