python 导入数据对不齐_NumPy：使用loadtxt或genfromtxt读取参差不齐的结构

最新推荐文章于 2023-06-27 16:22:38 发布

weixin_39633455

最新推荐文章于 2023-06-27 16:22:38 发布

阅读量783

点赞数

文章标签： python 导入数据对不齐

NumPy 数据解析嵌套结构元组数据类型

关键词由CSDN通过智能技术生成

据我所知，你确实需要一个定制的循环“分铸”。在

事实上，NumPy可以读取像您这样的嵌套结构，但它们必须具有固定的形状，如Innumpy.loadtxt('data.txt', dtype=[ ('time', np.uint64), ('pos', [('x', np.float), ('y', np.float)]) ])

尝试使用所需的数据类型读取数据时，NumPy只读取每个元组的第一个数字：

^{pr2}$

因此打印[(9998, 1, 1, 128, '10097')

(9999, 1, 1, 128, '10098')

(10000, 1, 1, 128, '10099')…]

所以，我会说继续使用for循环，而不是numpy.loadtxt()。在

您还可以使用一种可能更快的中间方法：让NumPy用上述代码加载文件，然后手动“更正”N字段：dt=[('E', '

arr = numpy.loadtxt('data.txt', dtype=dt) # Correctly reads the first 4 columns

with open('data.txt') as input_file:

for (line_num, line) in enumerate(input_file):

arr[line_num]['N'] = tuple(int(x) for x in line.split()[4:]) # Manual setting of the tuple column

这种方法可能比在for循环中解析整个数组要快。这将产生您想要的结果：[(9998, 1, 1, 128, (10097, 10098, 10199, 10198, 20298, 20299, 20400, 20399))

(9999, 1, 1, 128, (10098, 10099, 10200, 10199, 20299, 20300, 20401, 20400))

(10000, 1, 1, 128, (10099, 10100, 10201, 10200, 20300, 20301, 20402, 20401))

(10001, 1, 2, 44, (2071, 2172, 12373, 12272))

(10002, 1, 2, 44, (2172, 2273, 12474, 1237))]

weixin_39633455

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 导入数据对不齐_NumPy：使用loadtxt或genfromtxt读取参差不齐的结构

据我所知，你确实需要一个定制的循环“分铸”。在事实上，NumPy可以读取像您这样的嵌套结构，但它们必须具有固定的形状，如Innumpy.loadtxt('data.txt', dtype=[ ('time', np.uint64), ('pos', [('x', np.float), ('y', np.float)]) ])尝试使用所需的数据类型读取数据时，NumPy只读取每个元组的第一个数字：^...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。