python中Series+DataFrame索引和复合索引以及案例

在这里插入图片描述

Series索引和复合索引

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

DataFrame复合索引

在这里插入图片描述

使用matplotlib呈现出店铺总数排名前10的国家

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
# 以下两句是显示中文的方法
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei'] #有效的方法
file_path='C:/Users/ming/Desktop/DataAnalysis-master/day05/code/starbucks_store_worldwide.csv'
df=pd.read_csv(file_path)
# 使用matplotlib呈现出店铺总数排名前10的国家
# 准备数据,默认情况下是升序的我们需要按照降序的方式排列,所以设置ascending=False
data1=df.groupby(by='Country')['Brand'].count().sort_values(ascending=False)[:10]

_x=data1.index
_y=data1.values

# 画图
plt.figure(figsize=(8,6),dpi=80)
plt.bar(range(len(_x)),_y)
plt.xticks(range(len(_x)),_x)
plt.xlabel('国家')
plt.ylabel("店铺数量")
plt.title("国家和店铺数量")
plt.show()

在这里插入图片描述

使用matplotlib呈现出每个中国每个城市的店铺数量

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
# 以下两句是显示中文的方法
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei'] #有效的方法
file_path='C:/Users/ming/Desktop/DataAnalysis-master/day05/code/starbucks_store_worldwide.csv'
# 读取文件
df=pd.read_csv(file_path)
# 选中中国
df=df[df['Country']=='CN']
# 读取字段
print(df.info())
# 使用matplotlib呈现出店铺总数排名前10的国家
# 准备数据,默认情况下是升序的我们需要按照降序的方式排列,所以设置ascending=False
data1=df.groupby(by='City')['Brand'].count().sort_values(ascending=False)[:25]

_x=data1.index
_y=data1.values

# 画图
plt.figure(figsize=(8,6),dpi=80)

# plt.bar(range(len(_x)),_y,width=0.3,color='orange')
plt.barh(range(len(_x)),_y,height=0.3,color='orange')

plt.yticks(range(len(_x)),_x)
plt.xlabel('店铺数量')
plt.ylabel("城市")
plt.title("中国城市和店铺数量")
plt.show()

在这里插入图片描述
在这里插入图片描述

from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
# 以下两句是显示中文的方法
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei'] #有效的方法
file_path='C:/Users/ming/Desktop/DataAnalysis-master/day05/code/books.csv'
df=pd.read_csv(file_path)
print(df.info())
# 不同年份书的数量
# 去除nan数据
# data1=df[pd.notnull(df['original_publication_year'])]
# grouped=data1.groupby(by='original_publication_year').count()['title']
# 不同年份数的评分情况
data1=df[pd.notnull(df['original_publication_year'])]
grouped=data1['average_rating'].groupby(by=data1['original_publication_year']).mean()
# print(grouped)
_x=grouped.index
_y=grouped.values
plt.plot(range(len(_x)),_y)
plt.xticks(list(range(len(_x)))[::10],_x[::10].astype(int),rotation=45)
plt.show()


在这里插入图片描述
总结
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值