numpy.array创建数组报错ValueError: invalid literal for long() with base 10


最近在爬一个博客,爬下来的数据保存在一个二维列表中(元素是列表的列表)。在用numpy.array创建二维数组的时候报错:ValueError: invalid literal for long() with base 10,后来把博客数据修改为元组的列表解决。虽然能解决问题,但还没找到根本原因,官网推荐是用元组的列表,在stackoverflow上也有相关的帖子但是也没有找到真正的原因。
注:博客数据类型有整数和中文字符串。

用列表的列表(list of list)创建numpy.array

创建列表的列表:

import numpy as np
list1 = [
    [1,'张三'],
    [2,'李四'],
    [3,'王五']
]
print list1
for i in list1:
    print i[0],i[1]

输出结果:

[[1, '\xe5\xbc\xa0\xe4\xb8\x89'], [2, '\xe6\x9d\x8e\xe5\x9b\x9b'], [3, '\xe7\x8e\x8b\xe4\xba\x94']]
1 张三
2 李四
3 王五

创建自定义数据类型

dt = np.dtype([('id','i'),('name','S20')])
print dt

结果

[('id', '<i4'), ('name', 'S20')]

创建numpy.array报错

arr1 = np.array(list1,dtype=dt)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-4-1748646e8316> in <module>()
----> 1 arr1 = np.array(list1,dtype=dt)
ValueError: invalid literal for long() with base 10: '\xe5\xbc\xa0\xe4\xb8\x89'
print '\xe5\xbc\xa0\xe4\xb8\x89'
张三

用元组的列表(list of tuple)创建numpy.array

注意list2与list1的区别:

list2 = [
    (1,'张三'),
    (2,'李四'),
    (3,'王五')
]
print list2
for i in list2:
    print i[0],i[1]
[(1, '\xe5\xbc\xa0\xe4\xb8\x89'), (2, '\xe6\x9d\x8e\xe5\x9b\x9b'), (3, '\xe7\x8e\x8b\xe4\xba\x94')]
1 张三
2 李四
3 王五
arr1 = np.array(list2,dtype=dt)
print type(arr1)
print arr1
for i in arr1:
    print i[0],i[1]
<type 'numpy.ndarray'>
[(1, '\xe5\xbc\xa0\xe4\xb8\x89') (2, '\xe6\x9d\x8e\xe5\x9b\x9b')
 (3, '\xe7\x8e\x8b\xe4\xba\x94')]
1 张三
2 李四
3 王五
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值