首先,我们构造一个dataframe来看一下它的数据类型:
实际上dtype对象来自NumPy,它描述了ndarray中元素的类型。ndarray中的每个元素的字节大小必须相同。对于int64和float64,它们是8字节。所以col2和col3系统可以自动识别出来是float和int类型的,但是对于col4中,既有布尔类型也有数值类型的,系统无法给出一个统一的类型,因此显示的是object。此外对于col1这种字符类型的数据,由于字符串的类型长度也是不定的,因此Pandas没有直接在ndarray中保存字符串的字节,而是使用object ndarray,它保存的是指向对象的指针,因此这种类型的ndarray的数据类型是object。
在对数据进行处理的时候以防同一列的数据类型太乱,可以先转换一下数据类型。
dataframe的object类型
最新推荐文章于 2024-05-27 22:54:20 发布