01
写在前面
我知道大多数生物信息工作者是使用R来作图的,R语言有丰富的package和友好的可视化界面,方便快捷,易于上手。
但是因为工作需要,我一直是使用windows连接到linux平台的服务器处理数据,一般使用python对文本数据进行前期的处理,输出的结果都是保存在服务器上,如果要作图,需要把文件下载下来再用R编辑,就觉得有些麻烦。
于是最开始我就考虑是否有python的替代方案,然后发现python其实也有专门绘图的模块matplotlib等。
所以现在我用python的pandas、scipy模块处理数据,用它的matplotlib、seaborn模块作图,直接就可以在服务器上输出需要的图片。
那话不多说,今天我先给大家介绍下python下boxplot的作图,大家可以了解下它和R有啥不同(可能比R的操作要复杂一些,见谅见谅)。
02
简单boxplot
python下我用的最多的应该是matplotlib
它自带有boxplot函数
这里先以经典的鸢尾花iris.csv数据来作图。
数据为5列150行矩阵,5列中包含4个特征:
萼片长宽(SepalLength、SepalWidth)
花瓣长宽(PetalLength、PetalWidth)
以及最后一列花名(Name;三种花 'Iris-setosa' 'Iris-versicolor' 'Iris-virginica')。
import pandas as pd #导入二维数组操作模块pandasdata = pd.read_csv('iris.csv') #导入数据print(data.head()) #打印数据前五行,结构如下: SepalLength SepalWidth PetalLength PetalWidth Name0 5.1 3.5 1.4 0.2 Iris-setosa1 4.9 3.0 1.4 0.2 Iris-setosa2 4.7 3.2 1.3 0.2 Iris-setosa3 4.6 3.1 1.5 0.2 Iris-setosa4 5.0 3.6 1.4 0.2 Iris-setosa