数据分析-day04-pandas-dataFrame的综合案例三:不同年份书的数量和不同年份书的平均评分情况

#!usr/bin/env python
#-*- coding:utf-8 _*-
'''
@author:Administrator
@file: pandas_dataframe_cases3.py
@time: 2020-01-05 下午 4:10
1.不同年份书的数量
2.不同年份书的平均评分情况

'''
import pandas as pd
from matplotlib import pyplot as plt
#windows下设置字体
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
file_path = "../data/books.csv"
df = pd.read_csv(file_path);
print(df.info())
print("#####################################不同年份书的数量###############")
#缺省值的处理,去除掉空值
df=df[pd.notnull(df["original_publication_year"])]
df_count=df.groupby(by="original_publication_year")["title"].count();
print(df_count)
x=df_count.index;
y=df_count.values;
print("#####################################不同年份书的平均评分情况###############")
'''
df=df[pd.notnull(df["original_publication_year"])]
df_means=df.groupby(by=df["original_publication_year"])["average_rating"].mean();
x=df_means.index;
y=df_means.values;
'''
#画图
plt.figure(figsize=(20,8),dpi=70);
plt.plot(range(len(x)),y);
#x[::10],从开始,到结束,步长为10的取数据
plt.xticks(list(range(len(x)))[::10],x[::10],rotation=90)
plt.show();

不同年份的销售书的量:

 

 

 

 

 

 

不同年份销售书的平均值:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值