数据分析-day04-pandas-dataFrame的综合案例三：不同年份书的数量和不同年份书的平均评分情况

最新推荐文章于 2022-04-16 20:57:41 发布

健康平安的活着

最新推荐文章于 2022-04-16 20:57:41 发布

阅读量650

点赞数 1

分类专栏：数据分析

本文链接：https://blog.csdn.net/u011066470/article/details/103844569

版权

数据分析专栏收录该内容

44 篇文章 2 订阅

订阅专栏

#!usr/bin/env python
#-*- coding:utf-8 _*-
'''
@author:Administrator
@file: pandas_dataframe_cases3.py
@time: 2020-01-05 下午 4:10
1.不同年份书的数量
2.不同年份书的平均评分情况

'''
import pandas as pd
from matplotlib import pyplot as plt
#windows下设置字体
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
file_path = "../data/books.csv"
df = pd.read_csv(file_path);
print(df.info())
print("#####################################不同年份书的数量###############")
#缺省值的处理，去除掉空值
df=df[pd.notnull(df["original_publication_year"])]
df_count=df.groupby(by="original_publication_year")["title"].count();
print(df_count)
x=df_count.index;
y=df_count.values;
print("#####################################不同年份书的平均评分情况###############")
'''
df=df[pd.notnull(df["original_publication_year"])]
df_means=df.groupby(by=df["original_publication_year"])["average_rating"].mean();
x=df_means.index;
y=df_means.values;
'''
#画图
plt.figure(figsize=(20,8),dpi=70);
plt.plot(range(len(x)),y);
#x[::10],从开始，到结束，步长为10的取数据
plt.xticks(list(range(len(x)))[::10],x[::10],rotation=90)
plt.show();

不同年份的销售书的量：