python boxplot 分组_Python也可以画boxplot

01

写在前面

16814e77d0c64c1610e357067061ff3b.gif 8e93a0f435f6b62b392cb70765765fcd.png

我知道大多数生物信息工作者是使用R来作图的,R语言有丰富的package和友好的可视化界面,方便快捷,易于上手。

但是因为工作需要,我一直是使用windows连接到linux平台的服务器处理数据,一般使用python对文本数据进行前期的处理,输出的结果都是保存在服务器上,如果要作图,需要把文件下载下来再用R编辑,就觉得有些麻烦。

于是最开始我就考虑是否有python的替代方案,然后发现python其实也有专门绘图的模块matplotlib等。

所以现在我用python的pandas、scipy模块处理数据,用它的matplotlib、seaborn模块作图,直接就可以在服务器上输出需要的图片。

b662f79ab0d56c6f0e5dcef5ebf6ca45.gif 9ffdcb1552302da28cf92ba5703474f4.gif

那话不多说,今天我先给大家介绍下python下boxplot的作图,大家可以了解下它和R有啥不同(可能比R的操作要复杂一些,见谅见谅)。

02

简单boxplot

e13cc400a87de5a7476f295ed12dac78.gif

python下我用的最多的应该是matplotlib

它自带有boxplot函数

203acfcdfda93bf1a5016e1bff2cb5ee.png

9ffdcb1552302da28cf92ba5703474f4.gif

这里先以经典的鸢尾花iris.csv数据来作图。

数据为5列150行矩阵,5列中包含4个特征:

萼片长宽(SepalLength、SepalWidth)

花瓣长宽(PetalLength、PetalWidth)

以及最后一列花名(Name;三种花 'Iris-setosa' 'Iris-versicolor' 'Iris-virginica')。

import pandas as pd #导入二维数组操作模块pandasdata = pd.read_csv('iris.csv') #导入数据print(data.head()) #打印数据前五行,结构如下:          SepalLength  SepalWidth  PetalLength  PetalWidth            Name0            5.1         3.5          1.4         0.2     Iris-setosa1            4.9         3.0          1.4         0.2     Iris-setosa2            4.7         3.2          1.3         0.2     Iris-setosa3            4.6         3.1          1.5         0.2     Iris-setosa4            5.0         3.6          1.4         0.2     Iris-setosa
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值