3_Bivariate_plotting_with_pandas

基于pandas的双变量的作图 Scatter plot –> df.plot.scatter() 擅长: 区间数据、一些无序的分类数据 Hex plot –> df.plot.hex() 擅长: 区间数据、一些无序的分类数据 Stacked Bar Chart –> df.plot.bar(stacked=True) 擅长: 有序和无序的分类数据
摘要由CSDN通过智能技术生成

基于pandas的双变量的作图

  1. Scatter plot –> df.plot.scatter()
    • 擅长: 区间数据、一些无序的分类数据
  2. Hex plot –> df.plot.hex()
    • 擅长: 区间数据、一些无序的分类数据
  3. Stacked Bar Chart –> df.plot.bar(stacked=True)
    • 擅长: 有序和无序的分类数据
  4. Bivarite Line Char –> df.plot.line()
    • 擅长: 有序的分类数据和区间数据

没有数据关系的数据是空白的无意义的。为了能画出以上的图形,我们需要理解两个变量之间是如何交互的。
是否同时增减,是否存在线性关系,为了更好的看出这些关系,我们最好从图形上来观察。

import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline
df_reviews = pd.read_csv('../dataSet/winemag-data_first150k.csv',index_col=0)

df_reviews.head(3)
country description designation points price province region_1 region_2 variety winery
0 US This tremendous 100% varietal wine hails from … Martha’s Vineyard 96 235.0 California Napa Valley Napa Cabernet Sauvignon Heitz
1 Spain Ripe aromas of fig, blackberry and cassis are … Carodorum Selección Especial Reserva 96 110.0 Northern Spain Toro NaN Tinta de Toro Bodega Carmen Rodríguez
2 US Mac Watson honors the memory of a wine once ma… Special Selected Late Harvest 96 90.0 California Knights Valley Sonoma Sauvignon Blanc Macauley

Scatter plot

散点图是最简单的表示两个变量的图形。散点图能够很好的将两个变量的关系映射到二维空间上。

df_reviews[df_reviews['price'] < 100].sample(100).plot.scatter(x='price', y='points')
<matplotlib.axes._subplots.AxesSubplot at 0x7ff833c17518>

这里写图片描述

为了能更好的表示出这个图片,我们使用抽样的方式,抽取出100个点进行散点图显示。这是因为散点图不能表示映射到同一个点的多个点,
例如有10个(100,80)的点,在图上只能显示一个点。如果我们不使用抽样,你看到的图中会全是点,基本看不出来模式。如下图显示:

df_reviews[df_reviews['price'
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值