欢迎关注”生信修炼手册”!
bed文件用于记录染色体区域信息,最基本的一个bed文件示例如下
bed格式非常的灵活,可以有多个变种,比如转录本结构可以用bed12格式来记录,peak calling的结果可以用bed6+4来记录。常见的bed相关的格式有以下几种
bed
narrowpeak
broadpeak
bigbed
其中,narrowpeak和broadpeak常用于存储peak calling的结果,分别为bed6+4和bed6+3格式,即分别为10列和9列,bigbed是二进制的bed文件。
对于bigbed格式,可以通过UCSC提供的小工具来进行格式转换,用法如下
1. bed to bigbed
sort -k1,1 -k2,2n input.bed > sort.bed
bedToBigBed sort.bed hg19.chrom.sizes out.bigbed
2. bigbed to bed
bigBedToBed input.bigBed out.bed
上述bed格式都可以导入IGV进行查看,结果示意如下
bed文件中的每一行为一个染色体区域,对应图中蓝色的矩形区域。当bed文件的第四列提供了名称时,在矩形区域的下方会显示对应的标识符,而且可以根据标识符进行检索,示意如下
bed文件可以作为一个特征标识符, 来快速查找感兴趣的基因组区域,最经典的应用场景就是将peak calling的bed文件和对应样本的tdf文件同时导入IGV, 然后快速查看peak区域的测序深度分布情况。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!