进行HLA分析的软件通常需要准备fastq和bam文件,可通过比对到人类参考基因组后,提取HLA区域的bam数据,再转换为fastq,上述2个文件作为HLA分析软件的输入文件。
hg38人类参考基因组
chr6:28510120-33480577等区域为参考的HLA基因,可自行修改。测试数据bam来源于全外测序样本,WGS等测序数据操作类似。
hg38参考基因组下载(FTP):
https://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/001/405/GCA_000001405.15_GRCh38/
分析前准备
# 软件安装
conda install bwa, samtools, fastp
# hg38参考基因组下载
wget -c -b https://ftp.ncbi.nlm.nih.gov/geno