是否可以初始化一个可以保持字符串的numpy recarray,而不知道字符串的长度呢?
作为(设计)的例子:
mydf = np.empty( (numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ] )
问题是我正在使用信息填充我的重组,而且我不一定需要事先知道file_name的最大长度.
我所有的尝试导致字符串字段被截断:
>>> mydf = np.empty( (2,), dtype=[('file_name',str),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('', 6.9164002347457e-310), ('', 9.9413127e-317)],
dtype=[('file_name', 'S'), ('file_size_mb', '
>>> mydf['file_name']
array(['f', 'a'],
dtype='|S1')
(除此之外,mydf [‘file_name’]为什么显示’f’和’a’,而mydf显示”和”?
类似地,如果我用type(say)| S10为file_name初始化,那么事情将被截断为10.
我可以找到的唯一类似的问题是 this one
,但是这是先验计算适当的字符串长度,因此与我不一样(因为我事先知之甚少).
除了使用(例如)| S9999999999999(即一些可笑的上限)启动file_name,还有其他替代方法?