HIC测序数据生信分析——第一节,总体概述
HIC测序的目的
HIC测序的目的的研究染色体交联情况。我测序目的是De novo基因组测序组装,将contig基因组序列挂在到人工染色体上。HIC测序的难点是建库,测序类型:二代双端测序。
我的情况下,测序数据量是基因组大小的100倍左右。找公司测序,需要咨询清楚,我有两个公司,一个是建库后,先试测1~2G数据量,然后计算HIC有效率(Hicup软件),一般需要达到20%以上算合格,再测完整数据量。另一个直接测完整数据量,然后比较坑。
因为我从完整数据量中提取1~2G数据量,计算有效率,仅仅5%,所以浪费了,和公司沟通。
HIC测序数据分析流程
HIC测序分析流程解释
- 因为是二代数据,所以第一步过滤低质量的数据,使用软件Trim_galore
- 预处理HIC数据,指有效HIC测序数据,使用软件Hicup、ALLHiC和Juicer
- 挂载contig序列到人工染色体,软件ALLHiC和3D-DNA
- 如果是3D-DNA分析,则需要在软件Juicerbox中进行手工修正,再使用3D-DNA软件拿到最终基因组序列文件