Python探索性数据分析畅销书

探索性数据分析

探索性数据分析(EDA)是一种分析和调查数据集以了解数据特征的方法。

数据集

查看数据集示例,有许多与 2009 年至 2019 年在销售的畅销书的标题和作者相关的信息。 除了标题和作者之外,数据中还有其他元素,例如用户评分、评论、价格、年份和书籍类型。

PriceReviewsUser Rating
Count550550550
Mean13.111953.284.61
Std10.8411731.130.22
Min0373.3
25%740584.5
50%1185804.7
75%1617253.254.8
Max105878414.9

Python 分析数据集

数值数据行为

简述:使用Python探索畅销图书的评价和评分,直方图显示。

#distribution type books that goes hits by year (fiction / non fiction ) 
df_books = df.groupby(['Genre','Year']).agg({'Name':'nunique'}).reset_index()

ax = sns.barplot(x="Year", y="Name", hue='Genre', data=df_books)
sns.set(rc={'figure.figsize':(15,9)})
ax.set(xlabel='Year', ylabel='Total Books')

autolabel(ax.patches, labels= df_books.Name, height_factor=1.02)
ax.legend(loc=1, bbox_to_anchor=(1.0,1.1))

plt.title('Distribution of Total Books by Genre per Year') # Set the title

简述:Python 呈现畅销图书的价格密度图。利用箱线图分析来查看畅销书价格和评级每年的均值和中位数分布。创建每年总评论的可视化。创建基于总评论的密集排名作者。使用词云探索畅销书的标题数据。

源代码和数据集

详情参阅 亚图跨际

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值