#!usr/bin/env python
#-*- coding:utf-8 _*-
'''
@author:Administrator
@file: pandas_dataframe_cases3.py
@time: 2020-01-05 下午 4:10
1.不同年份书的数量
2.不同年份书的平均评分情况
'''
import pandas as pd
from matplotlib import pyplot as plt
#windows下设置字体
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
file_path = "../data/books.csv"
df = pd.read_csv(file_path);
print(df.info())
print("#####################################不同年份书的数量###############")
#缺省值的处理,去除掉空值
df=df[pd.notnull(df["original_publication_year"])]
df_count=df.groupby(by="original_publication_year")["title"].count();
print(df_count)
x=df_count.index;
y=df_count.values;
print("#####################################不同年份书的平均评分情况###############")
'''
df=df[pd.notnull(df["original_publication_year"])]
df_means=df.groupby(by=df["original_publication_year"])["average_rating"].mean();
x=df_means.index;
y=df_means.values;
'''
#画图
plt.figure(figsize=(20,8),dpi=70);
plt.plot(range(len(x)),y);
#x[::10],从开始,到结束,步长为10的取数据
plt.xticks(list(range(len(x)))[::10],x[::10],rotation=90)
plt.show();
不同年份的销售书的量:
不同年份销售书的平均值: