利用pandas库进行数据分析（三）

最新推荐文章于 2024-09-27 22:44:03 发布

NJU_AI_NB

最新推荐文章于 2024-09-27 22:44:03 发布

阅读量376

点赞数 8

分类专栏： pandas 文章标签： pandas 数据分析 python

本文链接：https://blog.csdn.net/aa12367/article/details/136118631

版权

pandas 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

使用pandas读取CSV文件，计算了不同年份书的平均评分，并绘制了折线图

# coding=utf-8
import pandas as pd
from matplotlib import pyplot as plt

# 设置pandas显示的最大行数、列数和宽度
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 100)
pd.set_option('display.width', 1000)

# 指定CSV文件路径
file_path = './books.csv'

# 使用pandas读取CSV文件
df = pd.read_csv(file_path)

# 打印前2行数据，用于检查
# print(df.head(2))

# 打印数据集信息，用于检查
# print(df.info())

# 去除original_publication_year列的nan的行
data1 = df[pd.notnull(df['original_publication_year'])]

# 按照'original_publication_year'列进行分组，并计算每个年份下书的平均评分
grouped = data1['average_rating'].groupby(by=data1['original_publication_year']).mean()

# 打印分组后的数据
# print(grouped)

# 获取年份和平均评分
_x = grouped.index  # 年份
_y = grouped.values  # 平均评分

# 创建一个大小为20x8，分辨率为80的图形
plt.figure(figsize=(20, 8), dpi=80)

# 绘制折线图，x轴是年份的索引，y轴是平均评分
plt.plot(range(len(_x)), _y)

# 打印年份的数量
print(len(_x))

# 设置x轴的刻度，使其对应年份，旋转45度以便更好地显示
plt.xticks(list(range(len(_x)))[::10], _x[::10].astype(int), rotation=45)

# 显示图形
plt.show()

这段代码的功能如下：