pandas 转化np数据_pandas 数据类型研究(一)数据转换

本文介绍了pandas中数据类型(data types)的概念,特别是object类型与numpy的关系。通过案例展示了如何处理数据类型问题,如将float64转换为int64,将字符串转换为数值类型,并提供了astype()、自定义转换函数、pd.to_numeric()和pd.to_datetime()等方法。同时,文章还讨论了在数据导入时直接转换数据类型的方法。
摘要由CSDN通过智能技术生成

当利用pandas进行数据处理的时候,经常会遇到数据类型的问题,当拿到数据的时候,首先需要确定拿到的是正确类型的数据,一般通过数据类型的转化,这篇文章就介绍pandas里面的数据类型(data types也就是常用的dtyps),以及pandas与numpy之间的数据对应关系。

dataframe中的 object 类型来自于 Numpy,  他描述了每一个元素 在 ndarray 中的类型 (也就是Object类型)。而每一个元素在 ndarray 中 必须用同样大小的字节长度。 比如 int64 float64, 他们的长度都是固定的 8 字节。

但是对于string 来说,string 的长度是不固定的, 所以pandas 储存string时 使用 narray, 每一个object 是一个指针

我们以官网案例作为解析,这样可以省去很多时间。

importpandas as pdimportnumpy as np

df= pd.read_csv("https://github.com/chris1610/pbpython/blob/master/data/sales_data_types.csv?raw=True")

然后我们查看每个字段的数据类型:

数据类型问题如下:

Customer number 应该是int64,不应该是float64

2016和2017两个字段是ob

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值