Python数据可视化,Matplotlib绘制“散点图”的两种方法!

前言

散点图是Matplotlib常用图形之一,与线形图类似。但是这种图形不再由线段连接,而是由独立的点、圆圈或其他形状构成。那么怎么画散点图呢?Matplotlib给出了两种不同的方法,去画散点图。如何在不同的情况下,合理的使用这两种方法?

python学习关注我们企鹅qun: 8393 837 65 各类入门学习资料免费分享哦!

用plt.plot画散点图

<pre >import numpy as np

import matplotlib.pyplot as plt

x= np.linspace(0, 10, 30)

y= np.sin(x)

plt.plot(x, y, 'o', color='black');

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

plt.plot函数的第三个参数是一个字符,表示图形符号的类型。与你之前用 '-' 和 '--' 设置线条属性类似,对应的图形标记也有缩写形式。

1.部分图形标记展示

<pre >rng= np.random.RandomState(0)

formarkerin['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']:

plt.plot(rng.rand(5), rng.rand(5), marker,

label="marker='{0}'".format(marker))

plt.legend(numpoints=1)

plt.xlim(0, 1.8);

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

2.连接每一个点

<pre >plt.plot(x, y, '-ok')# 直线(-)、圆圈(o)、黑色(k)

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

用图形标记的缩写形式,跟线段组合成一给新的字符,传给plt.plot函数

3.自定义线条和散点属性

<pre >plt.plot(x, y, '-p', color='gray',

markersize=15, linewidth=4,

markerfacecolor='white',

markeredgecolor='gray',

markeredgewidth=2)

plt.ylim(-1.2, 1.2)

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

plt.plot函数非常灵活,可以满足各种不同的可视化配置需求。

用plt.scatter画散点图

这是另一个创建散点图的函数是plt.scatter。它的功能非常强大,其用法与plt.plot函数类似。

<pre >plt.scatter(x, y, marker='o')

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

plot与scatter的区别

plt.scatter与plt.plot的主要差别在于,前者在创建散点图时具有更高的灵活性,可以 单独控制每个散点与数据匹配,也可以让每个散点具有不同的属性(大小、表面颜色、边 框颜色等)。

1.随机散点图

创建一个随机散点图,里面有各种颜色和大小的散点。为了能更好地显示重叠部分,用alpha参数来调整透明度。

<pre >rng= np.random.RandomState(0)

x= rng.randn(100)

y= rng.randn(100)

colors= rng.rand(100)

sizes= 1000*rng.rand(100)

plt.scatter(x, y, c=colors, s=sizes, alpha=0.3,

cmap='viridis')

plt.colorbar; # 显示颜色条

</pre>

Python数据可视化,Matplotlib绘制“散点图”的两种方法!

注意点,颜色自动映射成颜色条(color scale,通过colorbar显示),散点的大小以像素为单位。这样,散点的颜色与大小就可以在可视化图中显示多维数据的信息了。

plot与scatter:效率对比

plt.plot 与 plt.scatter 除了特征上的差异之外,还有什么影响我们选择的因素呢?在数 据量较小的时候,两者在效率上的差异不大。但是当数据变大到几千个散点时,plt.plot 的效率将大大高于 plt.scatter。这是由于 plt.scatter 会对每个散点进行单独的大小与颜 色的渲染,因此渲染器会消耗更多的资源。而在 plt.plot 中,散点基本都彼此复制,因此整个数据集中所有点的颜色、尺寸只需要配置一次。由于这两种方法在处理大型数据集时有很大的性能差异,因此面对大型数据集时,plt.plot 方法比 plt.scatter 方法好。

好啦,如果你跟我一样都喜欢python,想成为一名优秀的程序员,也在学习python的道路上奔跑,欢迎你加入python学习群:839383765 群内每天都会分享最新业内资料,分享python免费课程,共同交流学习,让学习变(编)成(程)一种习惯!

转载于:https://blog.51cto.com/14186420/2346967

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值