Matplotlib是一个Python的2D绘图库,通过Matplotlib,开发者可以仅需要几行代码,便可以生成折线图,直方图,条形图,饼状图,散点图等。详情可查看Matplotlib库API文档
1. 散点图
散点图也就X-Y图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
通过观察散点图上的数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。
2. 绘制散点图
散点图的绘制,使用的是 plt.scatter 方法,这个方法有以下参数:
(1) x,y:分别是 x 轴和 y 轴的数据集。两者的数据长度必须一致
(2) s:点的尺寸。如果是一个具体的数字,那么散点图的所有点都是一样大小,如果是一个序列,那么这个序列的长度应该和 x 轴数据量一致,序列中的每个元素代表每个点的尺寸
(3) c:点的颜色。可以为具体的颜色,也可以为一个序列或者是一个 cmap 对象
(4) marker:标记点,默认是圆点,也可以换成其他的
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
#读取运动员数据(姓名、性别、年龄、身高、体重)且删除NaN数据
athletes = pd.read_csv('new_athlete.csv').dropna()
plt<