Galaxy基础教程:从数据集合中过滤样本

我们将多个样本的测序数据构建成一个数据集合(List of Dataset Pairs)用于流程分析,但有可能个别样本的测序数据有问题,这时候我们如何从集合中删除该问题样本呢?

比如有这样一个数据集合:

42a939fad85ae21eec382e8a9e55480e.png

现在想过滤掉第1个样本:SRR6357071,可以这样操作:

1. 将样本信息存入一个文件

点击 Upload Data

ade3014c9f851d552f0cfead560d1847.png

在弹出的界面中:

  • 点击 粘贴数据或链接

2e19ce6d7b886e8643afc38cb7166704.png

  • 粘贴 SRR6357071

  • 点击 开始

完成上述操作后,会在右侧历史记录 Panel 看到一个新的文件:Pasted Entry

fdfb705831745ad5e3e532da4dfc8471.png

其内容为:SRR6357071

2. 过滤数据集合

左侧工具 Panel,搜索工具:Filter collection

参数设置:

  • Input Collection *:3 PE Fastqs

  • How should the elements to remove be determined?:Remove if identifiers are PRESENT in file

  • Filter out identifiers absent from *: Pasted Entry

ccbe1e6f7381e47a1e4164002534ce48.png

原集合将会被拆分成2个新的集合:

1c5a97586c29177c5502da8e3c640f20.png

filtered:包含过滤后剩下的样本。

45ec7e563a5e6d6757f03aedefaad1ee.png


discarded:包含过滤掉的样本。

4e9403af4f9694363b2ba7e8d5d936a5.png

后续就可以对集合中剩下的样本进行数据分析了。

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

  • 联系方式

    QQ交流群(免费):925694514

    微信交流群(免费):加微信好友,邀请入群

    客服微信:usegalaxy

b26da6c8da28d59c4c409a8f83950184.png

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值