csv附件
https://download.csdn.net/download/llf000000/86721674
准备的知识
seaborn
seaborn是python中的一个可视化库,是对matplotlib进行二次封装而成,既然是基于matplotlib,所以seaborn的很多图表接口和参数设置与其很是接近
import os
#大问题用第三方包解决,小问题用内置函数解决,这里用包
os.getcwd()
扩写:current working directory
获取当前工作目录,getcwd()是一个函数,在os包里,用于查看当前文件目录
sns.set_style('darkgrid')
sns.set_style? 打问号后会有提示出现
darkgrid背景是黑色带网格的
seaborn 库提供了五种绘图风格,分别是:darkgrid(灰色网格),whitegrid(白色网格),dark(深色),white(白色),ticks(刻度线段)
jitter
jitter:float或True
画散点图是很多点会重叠在一起,我们可以让他们呢稍微有点抖动,True让图稍微有点抖动
要应用的抖动量(仅沿分类轴)。 当您有许多点并且它们重叠时,这可能很有用,因此更容易看到分布。您可以指定抖动量(均匀随机变量支持的宽度的一半),或者仅使用True作为良好的默认值
alpha
代表透明度 ,100%的alpha会导致被遮盖的那一部分看不到
完成代码块
import os
os.getcwd()
# 读取数据
import pandas as pd
salaries = pd.read_csv('salaries.csv', index_col=0)
#把excel数据文件读到salaries这个变量里,这个变量是一个数据框(表结构dataframe)
# 查看数据
salaries.head()
我们看一下是不是真的读进来了
以上是数据的准备
# 导入seaborn包,并取别名为sns
import seaborn as sns
# 设置图片样式
sns.set_style('darkgrid')
# 绘制散点图
sns.stripplot(data=salaries, x='rank', y='salary', jitter=True, alpha=0.5)
# 绘制箱线图
sns.boxplot(data=salaries, x='rank', y='salary')
如果合并到一起的话
# 绘制散点图
sns.stripplot(data=salaries, x='rank', y='salary', jitter=True, alpha=0.5)
# 绘制箱线图
sns.boxplot(data=salaries, x='rank', y='salary')
目录