1. bedtools intersect 查找重叠区域
提取2个bed文件的重叠区域。
bedtools intersect -a region1.bed -b region2.bed > overlap.bed
2. bedtools merge 合并重叠的区域
合并输入bed文件的重叠区域。
bedtools merge -i region.bed > merge.bed
3. bedtools subtract 从一个文件中减去另一个文件的区域
在-a输入的bed文件中去除-b输入bed文件的区域。
bedtools subtract -a file1.bed -b file2.bed > subtracted.bed
4. bedtools coverage 计算覆盖度
根据-a输入的bed文件,计算区域的覆盖度。
bedtools coverage -a targets.bed -b reads.bam > coverage.txt
5. bedtools genomecov 计算基因组覆盖度
计算基因组的覆盖度,-g为参考基因组文件路径。
bedtools genomecov -ibam reads.bam -g genome.fa > genome_coverage.txt
6. bedtools complement 获取未被覆盖的区域
提取targets.bed中未覆盖的参考基因组区域。
bedtools complement -i targets.bed -g genome.fa > uncovered.bed
7. bedtools slop 扩展区间
扩展targets.bed文件区域两侧100bp。
# -b 向外扩展
# -l 向内扩展
bedtools slop -i targets.bed -g genome.fa -b 100 > extended.bed
8. bedtools flank 获取区间两侧的邻近区域
获取targets.bed区域两侧1000bp的区域。
bedtools flank -i targets.bed -g genome.fa -b 1000 > flank.bed
9. bedtools getfasta - 从FASTA文件中提取序列
基于regions.bed文件,从fasta文件中提取序列。
bedtools getfasta -fi genome.fa -bed regions.bed -fo sequences.fa
10. bedtools intersect 提取与基因重叠的变异
假设有两个BED格式文件:genes.bed和variants.bed,前三列都是染色体编号、起始坐标、结束坐标。
bedtools intersect -a variants.bed -b genes.bed > overlapping_variants.bed
11. bedtools merge 合并相邻的基因区域
sort -k1,1 -k2,2n genes.bed | bedtools merge > merged_genes.bed
12. bedtools subtract 找出不在基因区域内的变异
bedtools subtract -a variants.bed -b genes.bed > intergenic_variants.bed
13. bedtools coverage 计算每个基因区域内变异的数量
bedtools coverage -a genes.bed -b variants.bed > gene_variant_coverage.txt
14. bedtools getfasta 从基因组FASTA文件中提取变异位置的序列
bedtools getfasta -fi genome.fa -bed variants.bed -fo variant_sequences.fa
15. bedtools closest 对每个变异找到最近的基因
bedtools closest -a variants.bed -b genes.bed > nearest_gene_to_variant.bed
生信软件文章推荐
生信软件1 - 测序下机文件比对结果可视化工具 visNano
生信软件3 - mapping比对bam文件质量评估工具 qualimap
生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
生信软件7 - 多线程并行运行Linux效率工具Parallel
生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计
生信软件9 - 多公共数据库数据下载软件Kingfisher
生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa
生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV
生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )
生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计
生信软件14 - bcftools提取和注释VCF文件关键信息
生信软件15 - 生信NGS数据分析强大的工具集ngs-bits
生信软件17 - 基于fasta文件的捕获探针设计工具catch
生信软件18 - 基于docker部署Web版 Visual Studio Code
生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑
生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump
生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle
生信软件23 - Samtools和GATK去除PCR重复方法汇总
生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download
生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2
生信软件27 - 基于python的基因注释数据查询/检索库mygene
生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair
生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik
生信软件31 - Bcftools操作VCF/BCF文件高级用法合集
生信软件33 - Wgsim生成双端(PE) fastq模拟数据
生信软件34 - 大幅提升Python程序执行效率的工具Pypy
生信软件36 - SAM/BAM/CRAM文件插入SNV/INDEL/SV工具Bamsurgeon