让我直接开始问,我们真的需要Python来读取大型文本文件吗? 我们普通的文字处理程序或文本编辑器不能满足要求吗? 当我在这里提到大文件时,我指的是非常大的文件!
好吧,让我们看看一些证据,我们是否需要Python才能读取此类文件。
获取文件
为了进行实验,我们需要一个非常大的文本文件。 在本教程中,我们将从UCSC Genome Bioinformatics下载网站上获取此文件。 我们将使用特别的文件是hg38.fa.gz
文件,该文件描述这里是:
一个文件中的“软屏蔽”汇编序列。 小写显示了RepeatMasker和串联重复查找器的重复(周期为12或更短); 非重复序列以大写形式显示。
如果您不了解上述声明,因为它与遗传学术语有关,我不想让您担心。 在本教程中重要的是使用Python读取超大文本文件的概念。
继续下载