可视化系列(二):Plotly散点图(上)

欢迎加入我们卧虎藏龙的python讨论qq群:729683466

导  语

久等啦

可视化系列可能会迟到但不会缺席

快拿出小本本记重点

前一期没掌握好的同学记得复习一下嗷

代码及相关资源获取

1、关注"python趣味爱好者"公众号回复"plotly散点图1"

2、加入群聊:729683466,在群文件中下载源代码及相关资料。

开发工具

Jupyter Notebook

Plotly模块

往期精选

可视化系列(一):Plotly简介及示例

讲解部分

前言

上一期我们已经将plotly进行了简单的介绍,并举了一些例子;那么,从这一期开始,我们将正式进行plotly绘图的介绍。

本期我们介绍的是较为简单的散点图,它的样子相信大家应该都见过,大概就是下面这个样子:

但实际上,plotly绘制的散点图可不只是这个样子哦,它的花样可多了,保证能让你大开眼界~

在Plotly中,大部分的图都是可以通过两种方式绘制出来的,由于内容较多,所以本小节将只介绍第一种,第二种方式将在下一节介绍;

plotly.express.scatter()

官方大大称之为数据可视化的高级界面,也是比较常用的一种方法,现在我们就来看看它是怎么画图的,上代码:

import pandas as pd
import plotly.express as px

names = ["国家", "儿童死亡人数(每千人)", "商品和服务的人均出口", "人均卫生支出总额", "商品和服务的人均进口", "人均纯收入",
         "通货膨胀", "平均寿命", "新生儿数量(每个母亲)", "人均国内生产总值"]
df = pd.read_csv("../data/Unsupervised Learning on Country Data/Country-data.csv",
                 header=0,
                 names=names)

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习", # 图的标题
                 x="人均国内生产总值", # x轴
                 y="人均纯收入", # y轴
                 color="人均卫生支出总额", # 散点图的颜色
                 size="平均寿命", # 散点图的大小
                 hover_name="国家", # 悬停文本的标题
                 hover_data=["儿童死亡人数(每千人)",
                             "商品和服务的人均出口", "通货膨胀", "新生儿数量(每个母亲)"] # 悬停数据
                 )

fig.show()

这个段代码执行后所产生的图长这个样子:

是不是觉得这个散点图比上面那个好看多了,当然因为小编的水平也不高,所以这个图画的也不是很理想~但是这并不影响它的美观以及它所能表达的信息。

好了,那我们开始来介绍一下刚才写的这些代码:

import pandas as pd

这个是导入pandas库,用于数据处理的一个强大的第三方库,这里用来读取我们的数据。

import plotly.express as px

这个应该不用多解释了,导入我们需要画图的模块。

names = ["国家", "儿童死亡人数(每千人)", "商品和服务的人均出口", "人均卫生支出总额", "商品和服务的人均进口", "人均纯收入",
         "通货膨胀", "平均寿命", "新生儿数量(每个母亲)", "人均国内生产总值"]
df = pd.read_csv("../data/Unsupervised Learning on Country Data/Country-data.csv",
                 header=0,
                 names=names)

这几行代码是用于读取数据的,读取的数据原来长这个样子:

这是从kaggle官网所获取到的公开数据,因为原本他们的第一行标签都是英文,所以小编通过官方对这些标签的解释,对其进行的翻译(谷歌翻译,我啥也不懂~),将翻译的标签替换原来的标签,因此就产生了上面的 names 变量;替换完以后的数据长这样:

1

注意:

使用 pandas 读取数据时若要对标签进行替换,首先自己要准备好要替换的内容,一般以列表形式即可,然后使用 names 参数,于此同时,还要标明 header=0!如果不加这个,则会产生以下情况。

其他相关 pandas 的用法,同学们可以去它的官网自己看看:https://pandas.pydata.org/

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习", # 图的标题
                 x="人均国内生产总值", # x轴
                 y="人均纯收入", # y轴
                 color="人均卫生支出总额", # 散点图的颜色
                 size="平均寿命", # 散点图的大小
                 hover_name="国家", # 悬停文本的标题
                 hover_data=["儿童死亡人数(每千人)",
                             "商品和服务的人均出口", "通货膨胀", "新生儿数量(每个母亲)"] # 悬停数据
                 )

这里就是我们正式画图的代码了,可以看到小编已经把每个参数的用法在它们的后面已经进行简单的解释了,大家可以自行尝试一下每一个参数的具体表现,然后根据自己的需求进行舍弃。下面我们对每个参数进行详细的介绍:

参数一:

data_frame=

这个无需多说,就是绘图的数据源。

参数二:

tltle=

绘制出来的图的标题,可以自己随意命名。

参数三、四:

x=
y=

这个是绘图不可缺少的两个参数,x 轴和 y 轴所放入的数据,不同的数据都会让整个图绘制的大不一样。

参数五:

color=

这个参数用于改变散点图的颜色,plotly的颜色设置和其他的模块有点不一样,它的颜色可以直接用自己的数据来设置颜色,就如上面一样,我们这里用的是“人均卫生支出总额”数据,plotly 模块自动给我们自动找了一种色系来用于表示整个散点图的颜色。

参数六:

size=

这个参数是用于设置每个点的大小,也可以用我们自带的数据来加以设置,可以看到我们这次使用的是“平均寿命”来设置点的大小,由于各个国家的平均寿命相差不是很大,所以上图的演示没有体现出各个点的大小关系,同学们可以自己尝试使用其他差别较大的数据来设置点的大小,这样会比较明显一点。

参数七、八:

hover_name=
hover_data=

这两个参数是关于图形的悬停信息的设置,第一个是设置悬停信息的标题名称,第二个是设置悬停信息要显示的内容,可以使用列表的方式将其他标签加入其中,从而让悬停信息中显示更加多的内容。

fig.show()

这最后一行的作用就是让整个图绘制出来,咱也不知道为啥,反正就是要加~

至此,我们这个简单而又好看的散点图就大致完成了。同学们有木有很有成就感~

上面我们介绍了 scatter() 的常用参数,接下来我们继续介绍一下小编认为不是很常用的,但是感觉还是挺有用的一些参数。

参数九:

symbol=

这个参数是将散点图的点用其他的小图标表示,不过那个小图标一共好像只有五个,具体例子如下:

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习",
                 x="人均国内生产总值",
                 y="人均纯收入",
                 hover_name="国家",
                 
                 symbol="国家"
                 )

fig.show()

参数十:

text=

这个参数的作用是在散点图中显示指定的标签文本,具体例子如下:

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习",
                 x="人均国内生产总值",
                 y="人均纯收入",
                 hover_name="国家",
                 
                 text="国家"
                 )

fig.show()

额,这个显示不是很好,左下角的都糊成一坨了,,,不过我们可以清楚的看到右上角一些稀疏的散点上面有着每个国家的名字,这个参数小编觉得有时候应该挺有用的。

参数十一、十二:

width=
heigth=

这两个参数相信大家一眼就能看出来,用于控制图形的宽和高的,具体例子如下:

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习",
                 x="人均国内生产总值",
                 y="人均纯收入",
                 hover_name="国家",
                 
                 width=1000,
                 height=1000
                 )

fig.show()

参数十三、十四:

log_x=
log_y=

这两个参数的作用为如果它们都为 True ,那么将把 x,y 轴以对数缩放。这个可能比较难理解,通俗的来讲,就是将 x,y 轴的数据进行求对数,然后再进行绘图,具体例子如下:

fig = px.scatter(data_frame=df,
                 title="国家数据的无监督学习",
                 x="人均国内生产总值",
                 y="人均纯收入",
                 hover_name="国家",
                 
                 log_x=True,
                 log_y=True
                 )

fig.show()

这里我们可以很明显的看到,通过对 x,y 轴的数据进行求对数后,原来集中分布在左下角的数据已经变成大致呈线性分布了,所以说,这两个参数在某些情况下会产生意想不到的结果。

至此,scatter()的简单介绍就差不多结束了,我们上面介绍的也只是它的部分参数,有兴趣的同学可以去探索一下它一些其他的参数,这里给出传送门:

https://plotly.com/python-api-reference/generated/plotly.express.scatter.html

作者|十丿叶

编辑|潇洒哥

感谢大家观看

关注我们不迷路噢

扫码关注我们

QQ群:729683466

◰  

参考来源

Plotly官网

https://plotly.com/python/


数据来源

https://www.kaggle.com/

  • 8
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: Python数据分析是利用Python编程语言进行数据分析的过程。在数据分析中,经常需要将分析的结果进行可展示,提供更直观的信息呈现。而基于plotly的动态可则是一种利用plotly库进行数据绘,并且实现动态效果的方法。plotly是一个强大的绘库,它可以绘制各种类型的表,并且支持交互式操作,使得数据分析结果更加直观。 绘制动态可表的过程如下:首先,需要安装plotly库,并导入相应的模块。然后,根据需要,选择合适的表类型,比如折线等,利用plotly的绘函数进行绘制。可以设置表的布局、颜色、标题等属性,使得表更具美观性和可读性。接下来,根据数据的变,通过更新数据源或设置动画效果,实现表的动态效果。最后,将生成的表保存为PDF格式的文件,方便保存和分享。 使用基于plotly的动态可有以下几个优点:首先,plotly的绘功能十分强大,可以绘制各种类型的表,并且支持交互式操作,方便用户进行数据探索和分析。其次,动态可表可以更加生动地展示数据的变趋势和关系,增加了数据分析的直观性和可理解性。此外,生成的表可以保存为PDF格式的文件,方便与他人分享和使用。 总之,基于plotly的动态可可以帮助数据分析人员更好地展示分析结果,提供直观的信息呈现。它是数据分析中非常有用的工具之一,能够提升数据分析的效果和表现力。 ### 回答2: Python数据分析是利用Python编程语言进行数据分析的一种方法。其中,基于plotly的动态可是指使用plotly库来创建具有交互性和动态效果的表。而动态可的优势在于能够更直观地展示数据的变趋势和关联性。 在使用Python进行数据分析时,绘制可表是非常重要的步骤之一。而plotly作为一种强大的可库,提供了丰富的表类型和交互特性,能够满足各种数据分析的需求。通过使用plotly,用户可以绘制条形、折线、饼等各种常见表,并且可以根据需要添加交互功能,如缩放、悬停等。 与传统的静态表不同,动态可表能够更好地展示数据的变。例如,在时间序列数据分析中,绘制动态折线可以使用户更直观地看到数据随时间的变趋势。此外,通过添加滑块或按钮等控件,用户可以通过切换控件的状态来查看不同时间点的数据情况,进一步加深对数据的理解。 绘制动态可表并将其保存为PDF格式可以方便用户在不同设备上查看和分享。Python的绘库可以轻松实现将表保存为PDF文件的功能。只需使用相应的函数将绘制的表对象保存为PDF文件即可。这样,数据分析人员可以将生成的动态可表以PDF的形式分享给其他人,实现对数据分析过程和结果的可共享。 总结来说,基于plotly的动态可是一种强大的数据分析工具,能够通过交互性和动态效果更好地展示数据分析的结果。将绘制的表保存为PDF文件可以方便用户在不同设备上查看和分享。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值