联合分析操作记录-2021-05-14: sunxiaoyu_project

一、ChIP_seq 数据加工处理

1.建立相应目录

对新数据建立对应实验人员(sunxiaoyu)、测序类型(ChIP_seq)和日期(2021_05_14)的目录。

# 建立后如下:
(base) zexing@DNA:~/projects/sunxiaoyu/ChIP_seq/2021_05_14$

# 新建对应的目录
mkdir raw_data clean_data bam bam_bw bam_sort sam macs2_bdgdiff macs2_callpeak matrix_reference_point matrix_scale_regions fastqc_report MD5_txt scripts_log

2.检查数据完整性

(base) zexing@DNA:~/projects/sunxiaoyu/ChIP_seq/2021_05_14$ cat md5.txt > check_md5sum.txt && md5sum -c check_md5sum.txt
ScrPolII_L1_Q809604.R1.fastq.gz: OK
ScrPolII_L1_Q809604.R2.fastq.gz: OK
B8-PolII_L1_Q809606.R1.fastq.gz: OK
B8-PolII_L1_Q809606.R2.fastq.gz: OK
HScrPolII_L1_Q809608.R1.fastq.gz: OK
HScrPolII_L1_Q809608.R2.fastq.gz: OK
H8-PolII_L1_Q810604.R1.fastq.gz: OK
H8-PolII_L1_Q810604.R2.fastq.gz: OK
ScrK9ac_L1_Q810605.R1.fastq.gz: OK
ScrK9ac_L1_Q810605.R2.fastq.gz: OK
ScrK4me3_L1_Q810606.R1.fastq.gz: OK
ScrK4me3_L1_Q810606.R2.fastq.gz: OK
B8-K9ac_L1_Q810607.R1.fastq.gz: OK
B8-K9ac_L1_Q810607.R2.fastq.gz: OK
B8-K4me3_L1_Q810608.R1.fastq.gz: OK
B8-K4me3_L1_Q810608.R2.fastq.gz: OK
HScrK9ac_L1_Q811603.R1.fastq.gz: OK
HScrK9ac_L1_Q811603.R2.fastq.gz: OK
HScrK4me3_L1_Q811604.R1.fastq.gz: OK
HScrK4me3_L1_Q811604.R2.fastq.gz: OK
H8-K9ac_L1_Q811605.R1.fastq.gz: OK
H8-K9ac_L1_Q811605.R2.fastq.gz: OK
H8-K4me3_L1_Q811606.R1.fastq.gz: OK
H8-K4me3_L1_Q811606.R2.fastq.gz: OK

3. 在Linux服务器中对ChIP_seq数据进行处理。

vim新建ChIP_seq_script_1将数据质控、比对、格式转换、排序、生成目录、bamCoverage命令转换文件格式综合在一起。

#!/bin/bash
# 上面一行宣告这个script的语法使用bash语法,当程序被执行时,能够载入bash的相关环境配置文件。
# Program
#     This program is used for ChIP-seq data analysis.
# History
#     2021/05/13       zexing            First release
# 设置变量${dir}为常用目录
# 用户名称和日期需要更改
dir=/f/xudonglab/zexing/projects/sunxiaoyu/ChIP_seq/2021_05_13

# 对数据进行质控
fastqc -t 16 -o ${dir}/fastqc_report/ ${dir}/clean_data/*.fastq.gz

# 利用for循环进行后续操作
# 样品名称需要修改
for i in B8-K4me3_L1_Q810608 B8-K9ac_L1_Q810607 B8-PolII_L1_Q809606 H8-K4me3_L1_Q811606 H8-K9ac_L1_Q811605 H8-PolII_L1_Q810604 HScrK4me3_L1_Q811604 HScrK9ac_L1_Q811603 HScrPolII_L1_Q809608 ScrK4me3_L1_Q810606 ScrK9ac_L1_Q810605 ScrPolII_L1_Q809604 

do
# 对数据进行比对
bowtie2 -t -p 16 -x /f/xudonglab/zexing/reference/UCSC_hg19/bowtie2_index/hg19 -1 ${dir}/clean_data/${i}.R1.fastq.gz -2 ${dir}/clean_data/${i}.R2.fastq.gz -S ${dir}/sam/${i}.sam

# 对数据进行格式转换
samtools view -@ 16 -S ${dir}/sam/${i}.sam -1b -o ${dir}/bam/${i}.bam

# 对数据进行排序
samtools sort -@ 16 -l 5 -o ${dir}/bam_sort/${i}.bam.sort ${dir}/bam/${i}.bam

# 对数据生成目录
samtools index -@ 16 ${dir}/bam_sort/${i}.bam.sort 

# bamCoverage命令转换文件格式
bamCoverage -p 16 -v -b ${dir}/bam_sort/${i}.bam.sort -o ${dir}/bam_bw/${i}.bam.sort.bw

done

在后台运行ChIP_seq_script_1:

nohup bash ChIP_seq_script_1 > ChIP_seq_script_1_log &

4. 在Linux服务器中利用macs2软件进行broad call peak处理。

vim新建ChIP_seq_script_2将H3K4me3的数据进行broad peak calling。

#!/bin/bash
# 上面一行宣告这个script的语法使用bash语法,当程序被执行时,能够载入bash的相关环境配置文件。
# Program
#     This program is used for ChIP-seq data analysis.
# History
#     2021/05/13      zexing            First release
# 设置变量${dir}为常用目录
# 用户名称和日期需要更改
dir=/f/xudonglab/ze
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值