将数值型列降级到更高效的类型
我们可以用函数pd.to_numeric()
来对数值型进行向下类型转换。我们用DataFrame.select_dtypes来只选择整型列,然后我们优化这种类型,并比较内存使用量。
先找到要转化的类型,可用以下语句:
DataFrame.select_dtypes(include=None, exclude=None)
#include, exclude : scalar or list-like
#返回DataFrame
data_2 = data.select_dtypes(include=['int8'])#'int8'要放在列表中,返回的data_2是DataFrame格式的
然后让这些数据自动转化成占内存较小的数据类型。
pandas.to_numeric(arg, errors='raise', downcast