python 数据长度_python – ValueError:值的长度与索引的长度...

当您尝试将不同长度的numpy数组列表分配给数据帧时,会出现错误,并且可以按如下方式重现:

四行数据框:

df = pd.DataFrame({'A': [1,2,3,4]})

现在尝试为其分配两个元素的列表/数组:

df['B'] = [3,4] # or df['B'] = np.array([3,4])

两个错误:

ValueError: Length of values does not match length of index

因为数据框有四行,但列表和数组只有两个元素.

解决方案(谨慎使用):将列表/数组转换为pandas系列,然后在执行赋值时,系列中缺少的索引将填充NaN:

df['B'] = pd.Series([3,4])

df

# A B

#0 1 3.0

#1 2 4.0

#2 3 NaN # NaN because the value at index 2 and 3 doesn't exist in the Series

#3 4 NaN

对于您的特定问题,如果您不关心索引或列之间的值的对应关系,则可以在删除重复项后重置每列的索引:

df.apply(lambda col: col.drop_duplicates().reset_index(drop=True))

# A B

#0 1 1.0

#1 2 5.0

#2 7 9.0

#3 8 NaN

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值