你可以用熊猫。它们非常适合读取csv文件、制表符分隔的文件等。如图所示,当使用行/列进行访问时,panda几乎会一直正确地读取数据类型并将它们放入numpy数组中。
我使用了这个制表符分隔的“test.txt”文件:bbbbffdd 434343 228 D
bbbWWWff 43545343 289 E
ajkfbdafa 2345345 2312 F
这是熊猫密码。使用python中的一行代码,您的文件将在一个漂亮的数据框中读取。您可以将“sep”值更改为任何其他值以适合您的文件。import pandas as pd
X = pd.read_csv('test.txt', sep="\t", header=None)
然后尝试:print X
0 1 2 3
0 bbbbffdd 434343 228 D
1 bbbWWWff 43545343 289 E
2 ajkfbdafa 2345345 2312 F
print X[0]
0 bbbbffdd
1 bbbWWWff
2 ajkfbdafa
print X[2]
0 228
1 289
2 2312
print X[1][1:]
1 43545343
2 2345345
可以将列名添加为:X.columns = ['random_letters', 'number', 'simple_number', 'letter']
然后将列作为:X['number'].values
array([ 434343, 43545343, 2345345])