基于基因组获取对应的染色体名称及长度信息
方法一:基于测序的sam文件
我们在进行高通量测序分析的时候,比对后会获得sam文件。我认为大家基于“使用的参考基因组”来获取染色体名称和长度信息是最为准确的!
- 展示.sam文件的前20行
head -n 20 H3K27me3_Col0_replicate_1_1_val.sam
- SN:染色体名称
- LN:染色体长度信息
grep 'sn:' -i H3K27me3_Col0_replicate_1_1_val.sam
- 单独展示染色体信息
方法二:TBtools
- 下载基因组fasta文件
- 进入TBtools
- 点击
Sequence Toolkit————Fasta Tools————Fasta Stats
- 导入基因组文件
- 生成
.xls
文件
我们综合以上可以发现,两种方法得到的染色体名称和长度信息是一致的!