Python 数据可视化的 3 大步骤，你知道吗

程序员枸杞.

已于 2022-09-09 15:09:40 修改

阅读量373

点赞数 1

文章标签： python 数据挖掘机器学习

于 2022-09-09 15:01:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SixStar_FL/article/details/126782907

版权

本文介绍了Python数据可视化的三个关键步骤：确定问题并选择图形、转换数据和应用函数、参数设置。讨论了matplotlib和seaborn库，并强调了根据不同数据关系选择合适的图表类型，如scatter plot、line plot、bar plot和heatmap。还提到了数据转换方法，如合并、重塑、去重等，并介绍了如何通过设置参数优化图表的清晰度。

摘要由CSDN通过智能技术生成

Python实现可视化的三个步骤：

确定问题，选择图形
转换数据，应用函数
参数设置，一目了然

1、首先，要知道我们用哪些库来画图?

matplotlib

Python中最基本的作图库就是matplotlib，是一个最基础的Python可视化库，一般都是从matplotlib上手Python数据可视化，然后开始做纵向与横向拓展。

Seaborn

是一个基于matplotlib的高级可视化效果库，针对的点主要是数据挖掘和机器学习中的变量特征选取，seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图

其他库还包括

Bokeh（是一个用于做浏览器端交互可视化的库，实现分析师与数据的交互）；Mapbox（处理地理数据引擎更强的可视化工具库）等等

本篇文章主要使用matplotlib进行案例分析

第一步：确定问题，选择图形

业务可能很复杂，但是经过拆分，我们要找到我们想通过图形表达什么具体问题。分析思维的训练可以学习《麦肯锡方法》和《金字塔原理》中的方法。

这是网上的一张关于图表类型选择的总结。

在Python中，我们可以总结为以下四种基本视觉元素来展现图形：

点：scatter plot 二维数据，适用于简单二维关系；
线：line plot 二维数据，适用于时间序列；
柱状：bar plot 二维数据，适用于类别统计；
颜色：heatmap 适用于展示第三维度；

数据间存在分布，构成，比较，联系以及变化趋势等关系。对应不一样的关系，选择相应的图形进行展示。

第二步：转换数据，应用函数

数据分析和建模方面的大量编程工作都是用在数据准备的基础上的：加载、清理、转换以及重塑。我们可视化步骤也需要对数据进行整理，转换成我们需要的格式再套用可视化方法完成作图。

下面是一些常用的数据转换方法：

合并：merge，concat，combine_frist(类似于数据库中的全外连接)
重塑：reshape；轴向旋转：pivot（类似excel数据透视表）
去重：drop_duplicates
映射：map
填充替换：fillna,replace
重命名轴索引

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。