染色体坐标排序的两个方法

最新推荐文章于 2023-08-28 00:47:15 发布

Mrrunsen

最新推荐文章于 2023-08-28 00:47:15 发布

阅读量821

点赞数

分类专栏： R语言大学作业文章标签： R R语言 r语言

本文链接：https://blog.csdn.net/Mrrunsen/article/details/122899201

版权

R语言大学作业专栏收录该内容

1436 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

博客内容介绍了在处理染色体坐标排序时遇到的问题，包括两种解决方法：一是通过设置因子水平进行排序，二是利用数字前补0的方式。这种方法适用于包含X、Y等特殊染色体的情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

绘图的时候经常会遇到这个问题，有些NGS软件也会遇到。使用下面的代码模拟数据

pos_df=do.call(rbind,lapply(1:10, function(i){
  data.frame(gene=paste0('gene',i,LETTERS),
             chr=sample(paste0('chr',1:22),26,replace = T),
             start= sample(1:1000,26))
}))
pos_df=pos_df[with(pos_df,order(chr,start)),]
pos_df$chr=as.factor(pos_df$chr)
plot(pos_df$chr,pos_df$start,las=2)

首先我们的排序并没有按照染色体顺序，而是

> levels((pos_df$chr))
 [1] "chr1"  "chr10" "chr11" "chr12" "chr13" "chr14" "chr15" "chr16"
 [9] "chr17" "chr18" "chr19" "chr2"  "chr20" "chr21" "chr22" "chr3&

了解本专栏