全文共2338字,预计学习时长9分钟
图源:unsplash
病毒和其他微生物一样,为了在地球上存活,不断进化和变异。这对于人类来说就有点儿可怕了,尤其是新冠病毒肆虐全球的今天,它还想整什么幺蛾子?
事实上,变异已经发生了。先来看一段由人类病毒进化而来的蝙蝠病毒的RNA核苷酸序列:
AAAATCAAAGCTTGTGTTGAAGAAGTTACAACAACTCTGGAAGAAACTAAGTT
以及一段新冠病毒的RNA核苷酸序列:
AAAATTAAGGCTTGCATTGATGAGGTTACCACAACACTGGAAGAAACTAAGTT
显然,新冠病毒为了适应新宿主,其原始结构已发生改变。准确来说,已经有20%的原始结构发生变异,但因大部分结构并未改变,所以病毒还未发生变种。
图源:singularityhub
研究者发现新冠病毒已发生重复变异以持续存活。在与新冠病毒的较量中,我们不仅要知道如何消灭病毒,还要了解病毒如何变异以及怎样应对病毒变异。本文将尝试用K-Means和PCA探究这一点。
什么是基因组序列?
如果您对RNA核苷酸序列有所了解,那么可直接略过这部分内容。
基因组序列,通常我们称之为“解码”,是对样本进行DNA分析的重要步骤。一般来说,正常细胞中有23对携带DNA结构的染色体。