生物大数据
自2008年以来,摩尔定律不再是DNA测序成本的准确预测因子,因为它们在大规模并行测序技术(https://www.genome.gov/sequencingcosts/)到来后下降了几个数量级。这导致公共数据库(如GenBank和WGS )中的序列呈指数增长(如下图所示),引发了人们对大数据问题的进一步关注。事实上,科学界现在已经产生了超过exabyte(10的18次方)的数据。
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data