kaggle入门之data vislization

这篇博客介绍了kaggle入门级别的数据可视化教程,涵盖了直方图、线型图、双变量图的绘制,深入讨论了如何调整图表、使用seaborn库以及处理时间序列数据。还探讨了开源绘图库poltly和复杂变量的可视化技巧。
摘要由CSDN通过智能技术生成

直方图的绘制

# 直接绘制
reviews['province'].value_counts().head(10).plot.bar()
# 百分比图的绘制
(reviews['province'].value_counts().head(10) / len(reviews)).plot.bar()
# 一种与上述方法横坐标不同的直方图
reviews['points'].value_counts().sort_index().plot.bar()
# 统计直方图(横坐标是区间不再是单一值,为防止数据偏重,故加以小于200的限制)
reviews[reviews['price'] < 200]['price'].plot.hist()

线型图的绘制

# 普通绘制
reviews['points'].value_counts().sort_index().plot.line()
# 面积图(带有阴影的折线图)
reviews['points'].value_counts().sort_index().plot.area()

双变量的绘制

# 散点图的绘制
reviews[reviews['price'] < 100].sample(100).plot.scatter(x='price', y='points')
# 六角螺栓图(螺栓颜色的深度代表重复的次数)
reviews[reviews['price'] < 100].plot.hexbin(x='price', y='points', gridsize=15)
# 多变量,直方堆叠图
wine_counts.plot.bar(stacked=True)
# 折线堆叠图(与wine_counts有关)
wine_counts.plot.area()
# 多折线图
wine_counts.plot.line()

图的调整

# 图的尺寸调整(宽度,高度)
reviews['points'].value_counts().sort_index().plot.bar(figsize=(12, 6))
# 图的颜色调整
reviews['points'].value_counts().sort_index().plot.bar(figsize=(12, 6),color='mediumvioletred')
# 图的坐标尺寸调整
reviews['points'].value_counts().sort_index().plot.bar(figsize=(12, 6),color='mediumvioletred', fontsize=16)
# 图名
reviews['points'].value_counts().sort_index().plot.bar( figsize=(12, 6),color='mediumvioletred', fontsize=16, title='Rankings Given by Wine Magazine')
# 利用matplotlib.pyplot调整图名尺寸
ax.set_title("Rankings Given by Wine Magazine", fontsize=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值