![1e527b7d050b9429ee2bc90aa57cafb7.png](https://img-blog.csdnimg.cn/img_convert/1e527b7d050b9429ee2bc90aa57cafb7.png)
01. 引言
这篇推文还是python-matplotlib 散点图的绘制过程,涉及到的内容主要包括matplotlib ax.scatter()、hlines()、vlines()、text()、添加小图片和定制化散点图图例样式等。前期的数据处理部分还是pandas、numpy库的灵活 应用(这里主要涉及可视化的设置,数据处理、分析部分后期会专门开设专辑进行教程讲解。当然大家有不理解地方可以后台和我交流)。可视化效果如下:
![872ab6e836cd14bf81c546c98737da89.png](https://img-blog.csdnimg.cn/img_convert/872ab6e836cd14bf81c546c98737da89.png)
02. 数据处理
2.1 原始数据
原始数据主要如下(部分):
![3d901017a2f12ce29bb362c0000bdd6a.png](https://img-blog.csdnimg.cn/img_convert/3d901017a2f12ce29bb362c0000bdd6a.png)
首先对数据进行排序操作:
#按照'season','episode' 排序操作,并将na值放置最后
office = office.sort_values(by=['season','episode'],na_position='last')
这里提一下,后期构建的绘图数据集主要基于上数据集中“season”和“episode”两列数据。
2.2 构建绘图新数据
通过如下代码构建新的特征变量:
office['episode_id'] = office.index + 1
office['episode_mod'] = office['episode_id'] +