1、数据准备
下载链接:链接:https://pan.baidu.com/s/1GmE0tp_FkVF5NEVuhyEziA
提取码:rb9n
2、数据探索
(1)读取数据
landslides = pd.read_csv("…/input/landslide-events/catalog.csv")
(2)查看日期列数据
print(landslides[‘date’].head())
(3)查看日期列数据类型
landslides[‘date’].dtype
可以发现此时日期列的数据类型为Object,该数据类型为pandas不能正确解析的数据类型,在引用时被当做为字符串str,但在pandas中,能正常解析的时间类型为datetime64,因此需要通过pandas的时间类型处理操作进行格式转换
3、数据处理
在数据探索中,可以发现数据格式为"%m/%d/%y",因此通过to_datetime进行格式转换
#create a new column, date_parsed, with the parsed dates
landslides['date_parsed'] = pd.to_datetime(landslides['date'], format="%m/%d/%y")
借助以下代码可以看转换后的数据类型
landslides['date_parsed'].head()
4、数据应用
日期数据的导出
day_of_month_landslides = landslides['date_parsed'].dt.day
day_of_month_landslides.head()