在读这篇文章的时候https://mp.weixin.qq.com/s/fMI0gtpY426yPWp5NeKDGA 涉及到很多datetime64[ns]和object,以及时间戳之间的转换,领悟到拿到数据集之后要先了解数据类型,做好数据清洗再做分析才是王道。
数据类型的学习是来自这篇:https://www.cnblogs.com/onemorepoint/p/9404753.html
学习笔记:
1. 数据类型之间的映射:
2. 查看方式:
df.dtypes或者df.info()可查看各个字段的数据类型。
3. 类型转换:
如果不做数据清洗,很难进行下一步的数据分析,为了进行数据格式的转化,pandas里面有三种比较常用的方法:
# 1. astype()强制转化数据类型
# 2. 通过创建自定义的函数进行数据转化
# 3. pandas提供的to_nueric()以及to_datetime()
例如现在有一个df中一列df['customer order']是float64类型,需要转为int, 可以写成:
(1)df['customer order'].astype(int);