现在我们的DNA测序技术已经飞速发展,我们也分析出了越来越多的物种的基因组。
在这之中,对于全基因组分析,特异图 是一种新颖而重要的工具。特异图可以用直观和有效的方式来映射和可视化全基因组信息,例如基因密度,DNA甲基化分布,基因组一致性等。
但是,大多数用来基因组测定的软件程序仅适用于少数几种模型,例如人,鼠标和苍蝇,或具有有限的应用场景。越来越多的非模型物种需要测序,因此也需要比较完备的工具来测定更多生物的基因组信息。于是开发人员也做出了很多努力来开发基因测序软件,其中RIdeogram便是很厉害的基因组测序工具,据科学技术报告,RIdeogram不光可以测序,还能一键可视化基因信息,自动画出SVG图像,节省了使用者绘图的时间。
可能很多人不知道SVG是啥,这里简单介绍下。SVG是可伸缩矢量图形,它是在编程中一种用于描述二维图形的语言。SVG图形在可扩展标记语言(XML)文本文件中定义,所以人们可以轻松地使用任何文本编辑器,如记事本,或绘图软件来创建和编辑SVG图形,因此SVG的编辑并不难。
另外,RIdeogram工具也可用于显示两个或三个基因组之间的同义比较。此外,RIdeogram可以可视化双重基因组比较,例如人与小鼠之间的基因组同构性。与常染色体相比,人和小鼠X染色体之间的同义块几乎占据了每个X染色体的全部,这暗示了在真核哺乳动物谱系中X染色体的高度保守的同义关系。于是,使用RIdeogram工具可以很容易发现这种关系。
那么RLdeogrm是用什么编程语言写成的呢?
RIdeogram是用R语言编写的。R语言是广泛用于统计计算,数据分析和图形的最流行的编程语言之一。不过,R图形包不是基于任何现有的图形系统构建的,因此使用起来不太方便。
开发者使用R环境读取自定义输入文件,并在坐标系中计算图形元素的位置。接着R语言将所有元素信息按照XML格式写入文本文件,该文件用于通过SVG语言定义图形。RIdeogram的基因绘图功能也比较完善,可以满足大部分图形版本的需求,例如JPG,PNG,PDF等等各种版本的图形都可以绘出来,满足了不同使用习惯的人的需求。
使用RIdeogram可以了解基因如何在整个基因组中分布。例如,计算出蛋白质编码基因的数量,可以将其视为连续数据和500个随机选择的非编码RNA的位置,包括核糖体RNA(rRNA),转移RNA(tRNA)和microRNA(miRNA) ),都可以将其视为离散数据。
随后RIdeogram会将基因密度信息作为重叠特征映射到图像上,并在图像旁边添加跟踪标签,并分别代表rRNA,tRNA和miRNA。可以说这是一种非常方便的工具了。
总的来讲,随着生物学和计算机科学的发展,医学界对生物基因组的测序需求越来越大,而测序的难度却非常大,因此特别需要计算机提供越来越高级的工具帮助基因测序。于是乎很多技术便应运而生,其中RIdeogram便是时代的产物,它可以进行基因测序并自动绘制图像,节省了更多的时间成本。可以说,科学改变世界,带来了更美好的前景。