我正在尝试构建一个数组,其中每行包含来自不同序列的k聚体(k长度核苷酸串) . 我一直在读你不能真的有空数组,我很难尝试使用追加 .
bases = ['A', 'T', 'C', 'G']
self.profile = np.array([])
for x in range(1):
k = self.ksize
kmer = [''.join(p) for p in itertools.product(bases, repeat=k)]
for i in range(0, len(self.motifs)):
for q in range(0, len(kmer)):
if kmer[q] in self.motifs[i]:
self.kmers.append(kmer[q])
self.profile[i] = self.kmers
我在这里得到的错误是:“IndexError:索引0超出了0号轴的大小为0”
我意识到这是因为我没有指定数组的形状,但我只知道会有多少行,我不知道会有多少列(列大小取决于有多少k-mers是在每个序列中找到) .
如果我尝试将其列为“列表列表”:
bases = ['A', 'T', 'C', 'G']
self.profile = list()
for x in range(1):
k = self.ksize
kmer = [''.join(p) for p in itertools.product(bases, repeat=k)]
for i in range(0, len(self.motifs)):
for q in range(0, len(kmer)):
if kmer[q] in self.motifs[i]:
self.kmers.append(kmer[q])
self.profile[i] = self.kmers
我得到:self.profile [i] = self.kmers IndexError:列表赋值索引超出范围
有一个更好的方法吗?