python 按照某一列分组箱线图_柱形图、箱线图——常见图形大变身

本文介绍了基迪奥omicshare平台上的两个数据可视化小工具,包括如何制作断轴柱状图以解决数据差异大导致的观感问题,以及如何生成显著性标记箱线图,直观展示分组数据分布和显著性差异。详细的操作步骤和参数调整指南助力科研人员更高效地呈现数据。

实用科研工具推荐 、详实生信软件教程分享、前沿创新组学文章解读、独家生信视频教程发布,欢迎关注微信公众号:基迪奥生物 (gene-denovo

|本文作者:阿拉雷


万众期待的基迪奥omicshare平台小工具又来啦!

此次为大家带来两类常见图形的小工具---断轴柱状图以及两组、多组显著性箱线图。

0739703588cb1ce0ce9654c114d699bc.png

2c9306436da480afef67c2858bf5216c.png

一、断轴柱状图

柱状图(或称条形图)是数据展示最常用的图形之一,我们几乎每天都在和柱状图打着交道,就像每天喝水、吃饭一样稀松平常。当需要展示的数据间差异较大时,会出现一些“柱子”极高,而一些“柱子”低到几乎看不到的程度,严重破坏柱状图的观感体验。

因此,遇到数据差异较大时,有必要对柱状图这位“老朋友”加以改装,让它能更好地展现我们需要的信息。断轴柱状图用于解决这种由于数据间相差过大从而导致的部分数据被掩盖的问题,通过分段展示纵轴内容,保证高低数据都能得到合理的展示。

操作步骤

1.进入工具

工具地址:

OmicShare Tools - 基迪奥生物信息绘图云平台​www.omicshare.com
aad4965424a68d46f33b30601e9ee87c.png

复制前往以上链接,或登录Omicshare云平台→“软件中心”→搜索“断轴柱状图”。

2fd6bdf6257a1b96d908d0069e8aaef2.png
图1 断轴柱状图图标

2.输入表格、分组文件

点击图标进入后跳转至操作界面。界面包含“数据输入”与“调整参数”两部分,其中需要输入的两个文件为txt格式,可以用excel表另存为txt格式。

97346beb402c4fc4f6fe1368eb9bbf4f.png
图2 断轴柱状图输入文件


表格数据:

输入数据表格,第一行输入样本信息,第一列输入横轴对应分组信息。

37294a591a25e423dd35b3523a66f291.png
图3 断轴柱状图输入示例数据表格

分组表格:

输入样本对应的分组信息。

ff1855574b4f622489ce35192840f684.png
图4 断轴柱状图输入示例分组表格

3.作图参数调整

通过参数调整可以对输出图形做简单修改:

1)颜色:点击右侧选择颜色,按分组顺序依次添加颜色

2)第一段坐标轴比例:输入坐标轴下半段显示比例(0-1之间的数值,默认0.65,即第一段65%显示比例)

3)下断点值:输入断点下端位置数值

4)上断点值:输入断点上端位置数值

5)标题:输入标题信息

6)X轴标题:输入X轴名称

7)Y轴标题:输入Y轴名称

示例参数调整:

b3dc90907429b00c3e8d5edf14063f92.png
图5 断轴柱状图示例参数调整

4.输出结果

根据输入的表格数据,输出对应的纵断轴柱状图。

8ea02aa655cadeb1767d4a74444d5222.png
图6 断轴柱状图示例结果图形

注:横轴对应显示数据表格第一列信息,每个柱子信息由分组表格生成。


二、显著性标记箱线图

除了柱状图外,还有一类图形同样常见,那就是显著性箱线图。它能直观展示每个分组的整体数据分布、中位数信息、数据上下限等。通过显著性标记,还能直观看到两组间、多组间的显著性差异信息。显著性箱线图整合了这一系列信息,用简单的图形语言表达,省去了麻烦、易错的表格查询过程。为了能让大家都用上这么好玩、有用的图形,我们针对两组、多组数据对应开发了显著性箱线图。

操作步骤

1.进入工具

工具地址:

(两组)

OmicShare Tools - 基迪奥生物信息绘图云平台​www.omicshare.com
aad4965424a68d46f33b30601e9ee87c.png

(多组)

OmicShare Tools - 基迪奥生物信息绘图云平台​www.omicshare.com
aad4965424a68d46f33b30601e9ee87c.png

复制前往以上链接,或登录Omicshare云平台→“软件中心”→搜索“显著性箱线图”。

8641b9c2ae3f094b27a3736ac54f2e73.png

2.输入表格、分组文件

点击图标进入后跳转至操作界面。界面包含“数据输入”与“调整参数”两部分,其中需要输入的文件为txt格式,可以用excel表另存为txt格式。

按列输入分组信息,两组比较则对应输入两列数据信息,多组比较则输入对应列数信息,每个分组至少有三个重复数据,针对多组数据,系统会进行两两分组比较。

示例数据表格:

dc5fc7280fad4629a5064f3b637eacb9.png
图7 显著性标记箱线图示例输入数据表格

3.作图参数调整

通过参数调整可以对输出图形做简单修改:

1)统计检验方法选择:T检验或wilcoxon秩和检验。(两组检验方式均为常见的组间统计检验方法。其中,t检验(t-test)是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。Wilcoxon秩和检验,也称Mann-Whitney U检验,是一种非参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同)

2)X轴标题:输入纵坐标名称3)Y轴标题:输入横坐标名称4)图表标题:输入整个图表的名称

4.输出结果

Ttest.Pvalue. xls:T检验差异检验结果(参数选择T检验,输出的是T检验差异检验结果表格)

412ac4d7881a19dd085032fbcd19e9fe.png
图8 显著性标记箱线图示例结果表格1

5e2d2ed9c9bcfdd9c9589564f2eee4c2.png
图9 显著性标记箱线图示例结果表格2

T-test.diff.pdf/png(或wilcox.diff.pdf/png):箱线图(选择对应检验方式,输出对应显著性标记箱线图)

c6570fc5daf58dfc922331d1775f2d0a.png
图10 显著性标记箱线图示例结果图形1

759e8c60bb5f7869d9811580640d0927.png
图11 显著性标记箱线图示例结果图形2

注:横坐标为两个比较组名称,纵坐标为样本数据的分布值。*代表显著性,*代表两组间差异小于0.05.**代表两组间差异小于0.01,***代表两组间差异小于0.001,以此类推。

今天介绍的小工具,大家觉得实用吗?欢迎大家前往Omicshare云平台体验!

云平台地址:

OmicShare Tools - 基迪奥生物信息绘图云平台​www.omicshare.com
aad4965424a68d46f33b30601e9ee87c.png

今天的内容就到这里~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值