python中dtypes_关于python:如何通过pandas DataFrame中的列设置dtypes

本文探讨了在Python的Pandas库中为DataFrame设置列数据类型(dtypes)时遇到的问题和解决方案。当尝试直接通过dtype参数指定列数据类型时,可能会遇到错误,如TypeError。解决方案包括使用astype()方法逐列转换,或利用DataFrame.from_records()与结构化numpy数组配合。同时,强调了在指定dtype时需使用字符串形式或numpy类型。
摘要由CSDN通过智能技术生成

我想将一些数据带入pandas DataFrame,并为导入时的每一列分配dtypes。 我希望能够对具有许多不同列的较大数据集执行此操作,但是,例如:

myarray = np.random.randint(0,5,size=(2,2))

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype=[float,int])

mydf.dtypes

结果是:

TypeError: data type not understood

我尝试了其他一些方法,例如:

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': int})

TypeError: object of type 'type' has no len()

如果我放dtype=(float,int),它将浮点格式应用于两列。

最后,我希望能够将其传递给数据类型列表,就像我将其传递给列名称列表一样。

dtype的参数应该是有效的numpy dtype(并且不支持结构化dtype),因此列表或字典将不起作用。 一种可能的方法是分别为每个列进行分类。 或者首先创建一个结构化的numpy数组,并将其提供给DataFrame。

我知道我可以在循环中分别分配每个对象,但令我惊讶的是dtype =不够灵活,无法容纳列表。 不过感谢您的回答,很高兴得到确认:)

github.com/pydata/pandas/issues/4464目前是一

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值