叶绿体基因组共线性分析与四分体结构鉴定

叶绿体基因组 四分体结构鉴定

B站视频

序列获取

组装过程
getorganelle和Spades等组装软件,得到的fastg或者gfa文件解环得到fasta文件

序列调整

共线性分析

由于IR区域的存在,因此叶绿体基因组具有四分体结构,分别包括了一个LSC区域,一个LSC区域,两个IR区域,分别命名为IRa和IRb
而在叶绿体基因组分析过程中,首先要做的就是将叶绿体基因组序列调整至以LSC第一个碱基作为序列的起始,但叶绿体基因组为环状结构,可以在任何位置切开,且当跨区域序列较短时,使用Geseq等软件一般很难得到准确的结果,因此自己开发了鉴定四分体结构的脚本,脚本的获取请看上面的B站视频,里面讲解了具体的用法

SSC调整

SSC的调整请使用nucmer实现

conda install nucmer #或者使用源码安装

nucmer源码地址

nucmer --mum -p chloroplast ref.fasta test.fasta
delta-filter -m chloroplast.delta > chloroplast.filter
show-coords -T -r -l chloroplast.filter > chloroplast.1coords
mummerplot --postscript -p chloroplast chloroplast.delta
ps2pdf chloroplast.ps chloroplast.pdf

组装序列SSC方向与参考序列相同时,绘图如下
SSC和参考方向相同

组装序列SSC方向与参考序列相反时,绘图如下
SSC和参考序列相反时

写在最后

在这里插入图片描述

我们首先应该确定参考序列的SSC方向是我们想要的方向,一般是ycf1长基因位于SSC末端的是NCBI中常见的序列。
然后进行共线性分析,
如果结果如图3,表现出良好的共线性时(即一条直线时,则表示SSC方向相同),
如果如图4时,则表示SSC方向相反,因此需要进行SSC方向的调整。具体的脚本和使用方法,请看B站视频。

共线性参考链接

对于叶绿体基因组的滑动窗口分析,在生物信息学领域通常用于评估遗传多样性、核苷酸多态性或其他类型的变异率沿基因组的变化情况。这种技术可以提供关于特定区域内遗传变化模式的信息,有助于理解种群历史、选择压力以及分子进化等方面的问题。 为了对叶绿体基因组执行滑动窗口分析,以下是几个推荐的方法: 定义研究目标和参数 确定要解决的具科学问题,这将影响到如何设置滑动窗口大小、步长和其他可能需要调整的因素。比如,较小的窗口适合于高分辨率的研究,而较大的窗口则能捕捉更广泛的趋势但细节较少。 准备数据集 确保拥有高质量的叶绿体基因组序列数据。这些可以从公共数据库下载或者由自己的实验室生成。同时准备好参考序列,这对于比对样本非常重要。 选择合适的软件工具 多种计算生物学工具支持滑动窗口分析,包括但不限于DnaSP, PopART, SnpEff 和 VCFtools等。根据具需求挑选最适合的一款或多款组合使用。 实施滑动窗口算法 利用选定的程序加载输入文件,并配置好所需的选项如窗口尺寸(window size)、移动增量(step increment)等关键参数来进行实际运算处理。 解析输出结果 完成计算后仔细检查产生的统计值图表或图形表示形式的结果,从中提取有意义的数据点并尝试解释其背后的生物学意义。 可视化展示成果 采用适当的绘图方式把得到的主要发现呈现出来,便于交流分享研究成果给同行评审或是公众传播。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值