生物信息学分析服务器搭建教程,Snakemake搭建生信分析流程-步骤

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

什么是snakemake

官网地址:https://snakemake.readthedocs.io/en/stable/

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

使用snakemake的好处

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

process data with the same pipeline

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

自动生成拓扑图

ATAC-seq 基本原理

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

ATAC-seq基本原理

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

image.png

每个核小体上可以缠绕146-147bp的DNA,大概缠绕两圈左右,但是在核小体上并不是所有的组蛋白都有DNA缠绕;

有些地方转录比较活跃,chromatin accessibility 染色质可接近性比较大,那么这些裸露的DNA的转录活性高;

此时,我们可以用Tn5这种酶,这种酶就可以通过链置换反应,直接把测序建库的接头adapter直接就添加到裸露的DNA上,简单来说就是Tn5把裸露的DNA链打断,并通过链置换反应加上测序建库需要的adapter。

然后再对整个基因组测序,就能够捕获这样的信号,通过mapping到genome上,就知道哪一段DNA序列是裸露的了。

因为越裸露的区域,最终捕获的reads数目就越多。

如果某一段DNA紧紧地缠绕在核小体周围,那它基本上就是没有信号的。

那最后我们通过鉴定atac-seq的峰在哪里,我们就可以知道染色质哪里是比较开放的。

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

image.png

那么一个基因如果处于开放染色质,那么这个基因就是高表达的;

那么如果是一个promoter在开放空间的话,那么它就很可能导致下游的基因高表达;

那么如果是一个enhancer在atac-seq信号比较弱的区域,那么它可能不太可能发生近端的相互作用;

ATAC-seq的数据分析pipeline

bd58b2db9eaa?utm_campaign=hugo&utm_content=note&utm_medium=reader_share&utm_source=qq

image.png

1. 去除接头,cutadapt;

2. 对于切除adapter的fastq文件,我们需要使用类似于bowtie2的软件去mapping到参考基因组上;

3. 把比对完的结果要进行排序,并把它记录成BAM文件;

4. 对BAM文件进行remove PCR duplication;

5. 找peak,peak calling

snakemake基础教学与上机实践

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值