[每天一个python小技巧]遇到DtypeWarning 怎么办？？

最新推荐文章于 2024-07-31 15:42:56 发布

Monster_H777

最新推荐文章于 2024-07-31 15:42:56 发布

阅读量3.9k

点赞数 2

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/Monster_H7/article/details/111352972

版权

19 篇文章 8 订阅

订阅专栏

（发现问题）在运行项目的过程中，做数据分析，会读取到csv文件，最后在运行代码的时候报了这样的错误：DtypeWarning

DtypeWarning: Columns (0,9,13,20,24,26,32,33,36,41,55,60,61,63,64) have mixed types.Specify dtype option on import or set low_memory=False.

从警告的字面意思看是由于列(0,9,13,20,24,26,32,33,36,41,55,60,61,63,64)
中存在多种数据类型导致的。例如数值 3 被认为了是 int 类型，但是数值 3.4 可能被认为是 str 类型。

按照警告的提示，解决方法有两种：

（1）关闭 low_memory

data = pd.read_csv(f, low_memory=False)

（2）或者指定列的数据类型
例如我这里把这些列都让 Pandas 看作是 int：

data = pd.read_csv(f, dtype={"Columns1": int, "Columns2": int})

Pandas 在读取 csv 文件时时按块读取的，并不会一次性读取，并且对于数据的类型“都靠猜”，所以就可能出现了 Pandas 在不同块对同一列的数据“猜”出了不同的数据类型，也就造成了上述的警告。

关注

专栏目录