MCScanX和RIdeogram—同物种不同品系间 共线性分析与可视化

MCScanX和RIdeogram—同物种不同品系间 共线性分析与可视化

所需软件

blast
link
MCScanX
link
R包 RIdeogram

流程

比对

#准备两个品系的蛋白序列
makeblastdb -in A.pep.fa -dbtype prot -out A.pep
blastp -query B.fa -db A.pep -outfmt 6 -num_threads 20 -evalue 1e-5 -num_alignments 5 -out A_B.raw.blast 

过滤

identity≥80%,A coverage≥80%,B coverage≥80%
coverage 即 (query.end - query.start +1 )/query.length ≥0.8
(subject.end - subject.start +1 )/subject.length ≥0.8)
过滤后得到A_B.blast

简化gff

#得到A和B简化后的gff,第一列为染色体id,第二列gene id,三四列分别为起始坐标,如下所示
Chr01       A01110	10283   10858
Chr01       A01120     14247   17702
Chr01       A01130     19786   22962
Chr01       A01140     23827   25856
#合并A和B简化后的gff
cat A.gff B.gff > A_B.gff

MCScanX 共线性

#MCScanX会识别以A_B开头的A_B.blast和A_B.gff,切记blast与gff的前缀要保持一致
MCScanX A_B -s 10 #-s 过滤共线区域比较小的bolck

#结果如下
A_B.collinearity #记录了共线性信息
A_B.html #文件夹,不用管

具体结果在这里有详细说明
link

RIdeogram 可视化

准备如下两个文件
1.文件 len ,第一列染色体编号,二三列染色体起始位置,第四列染色体填充颜色,第五列物种,第六列可视化后物种名字大小,第七列物种名字填充的颜色
在这里插入图片描述
2.第一列A的染色体编号,二三列,具有共线性关系的A的gene_id的起始位置,第四列B的染色体编号,五六列共线性关系的B的gene_id的起始位置,第七列每个染色体填充的颜色
染色体编号须为数值,起始关系根据A_B.collinearity和gff文件可以提出
在这里插入图片描述

install.packages("devtools")
library(devtools) #或许需要安装usethis
devtools::install_github('TickingClock1992/RIdeogram')
install.packages("RIdeogram")
ideogram(karyotype = len, synteny = m)#计算处理
convertSVG("chromosome.svg", device = "png")#画图
svg2pdf("chromosome.svg")#svg转成pdf

可视化结果

上面为A
下面为B
在这里插入图片描述

  • 16
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于引用\[2\]和\[3\]的内容,物种基因家族共线性可以通过使用MCScanX软件进行分析。在这个过程中,首先需要对不同物种的基因组进行注释,并将比对结果整合成一组文件。然后,利用MCScanX进行共线性分析,寻找基因组共线性区段。MCScanX会根据染色体号的前缀将染色体划分为不同物种,并生成共线性区块。这些共线性区块可以通过circos图来展示物种的基因家族共线性关系。因此,通过使用MCScanX和circos图,可以研究物种基因家族的共线性。 #### 引用[.reference_title] - *1* [linux统计单拷贝基因家族,为什么要进行基因家族分析?](https://blog.csdn.net/weixin_36075067/article/details/116915395)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [利用 DIAMOND、MCScanX、TBtools 分析物种基因组共线性区段与基因复制事件](https://blog.csdn.net/sinat_41621566/article/details/113359074)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值