一、chip-seq的原理:
(1)ChIP-Seq(染色质免疫沉淀测序)是一种用于研究蛋白质与染色质相互作用的高通量测序技术;可视作染色体免疫共沉淀技术与二代测序技术的结合;ChIP可用于检测某种特异蛋白或某种特异蛋白修饰在某个基因组区域的相对丰度,可用来回答涉及蛋白质和染色质相互作用的问题;
(2)ChIP用来确定蛋白质与DNA相互作用情况,可用于研究组蛋白修饰情况;通过组蛋白特异性抗体,将带有特定修饰的组蛋白-DNA复合物沉淀下来,从而获得组蛋白结合的DNA。
(3)然后通过测序,可获得组蛋白在染色体上的分布情况,从而确定组蛋白修饰相关的特定位点,还可以确定组蛋白修饰酶类的靶标。
二:chip-seq的操作流程(粗略):
(1)交联:通过添加交联剂将蛋白质与染色质中的DNA交联在一起,固定它们的相互作用状态。
(2)细胞核提取:提取细胞核,然后细胞核膜被打破,释放核内的染色质。
(3)染色质免疫沉淀:使用特异性抗体结合到目标蛋白质上,然后通过蛋白质A/G磁珠等手段将蛋白质-染色质复合物沉淀。
(4)反交联:将蛋白质-染色质复合物中的交联解除,释放DNA。
(5)DNA纯化:通过酚/氯仿提取或其他方法纯化从ChIP中得到的DNA片段。
(6)文库构建:将DNA片段进行末端修复、连接测序适配器,并进行PCR扩增,构建成测序库。
(7)高通量测序:使用高通量测序技术,例如Illumina测序平台,对构建好的文库进行测序。
(8)数据分析:对测序得到的数据进行分析,包括序列比对、峰识别、富集区域的标定等步骤,以得到蛋白质与染色质相互作用的信息,如蛋白质结合位点、染色质富集区域等。
三、chip-seq的分析流程(粗略):
【分析流程需在linux环境中进行,建议安装conda,利用conda创建环境并安装fastqc、trim-galore、entrez-direct、fastq-dump、bowtie2、macs2、samtools等】
(1)下载数据:下载原始sra数据并获得样本信息,使用fastq-dump将sra文件转换为fastq文件(也可直接下载fastq文件);
(2)原始数据质控:使用fastqc对原始数据进行质控,得到网页版报告(html);
(3)清洗原始数据:使用trim_galore切除接头和低质量碱基,并使用fastqc获得清洗后的质控报告;
(4)序列对比:使用bowtie2进行mapping,也就是与参考基因组序列进行比对,得到sam文件,后使用samtools进行排序得到bam文件;此时bam文件仍需去重和过滤,得到最终可进行下一步分析的bam文件;
(5)callpeak:使用macs2识别数据中染色质区域由于特定蛋白结合而产生富集的区域,得到narrowpeak 形式为一个bed文件;
(6)若实验数据存在多个重复(多个rep):使用intervene取得数据间的交集,
(7)注释:使用homer对bed文件进行注释,标记peak在基因组上的区域;
四、IGV可视化:
(1)上述分析流程中得到bam文件后,使用deeptools转换为bigwig文件,在IGV里面打开此文件即可进行可视化分析;
(2)bigwig文件也可通过deeptools computeMatrix转换为矩阵文件,即可进行画图操作;