数据分析实战之数据可视化

本文介绍了数据可视化的分类,包括比较、联系、构成和分布四大类型,并详细讲解了10种常见视图:散点图、折线图、直方图、条形图、箱线图、饼图、热力图、蜘蛛图、二元变量分布和成对关系图。通过Matplotlib和Seaborn库的实例展示了如何绘制这些图表,帮助理解数据间的关联和趋势。
摘要由CSDN通过智能技术生成

一、可视化图有哪些

按照数据之间的关系,可以把可视化图分为4类

  • 比较:比较数据间各类别的关系,或者是它们随时间的变化趋势,比如折线图;
  • 联系:查看两个或两个以上变量之间的关系,比如散点图;
  • 构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图;
  • 分布:关注单个变量,或者多个变量的分布情况,比如直方图。

按照变量的个数,可以分为单变量分析和多变量分析

  • 单变量分析:指的是一次只关注一个变量
  • 多变量分析:可以在一张图上查看两个变量以上的关系

二、10种常见的视图

1、散点图:将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。

matpoltlib绘制可视化图形用pyplot这个工具包。在使用前需要先进行引用。也可以用seaborn这个工具包,使用前进行包的引用1)plt.scatter(x,y,marker=None)  x,y是坐标,marker代表了 标记的符号,选择不同的marker呈现出的符号样式也不同
2)sns.jointplot(x,y,data = None,kind = 'scatter')  x,y是data中的下标,data是要传入的数据;一般是DataFrame类             型;kind代表不同的视图绘图方式

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


n = 1000
x = np.random.randn(n)
y = np.random.randn(n)
plt.scatter(x,y,marker='*') 

df = pd.DataFrame({'x':x,'y':y})
sns.jointplot(x,y,data = df,kind = 'scatter')

   

Matplotlib 默认情况下呈现出来的是个长方形。而 Seaborn呈现的是个正方形,不仅显示出了散点图,还给了这两个变量的分布情况

2、折线图:表示数据随时间变化的趋势。

1)Matplotlib 使用plt.plot()函数

2)在Seaborn中使用sns.lineplot (x, y, data=None)函数。其中x,y是data中的下标,data是要传入的数据,一般是DataFrame类型

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值