任务描述
初始数据为 2021 年 11 月至 2022 年 3 月的农产品数据,所有的 csv 文件存放在 /data/workspace/myshixun/data/
目录下。按照下面的要求,使用 Python 完成农产品数据数据清洗。
相关知识
请在右侧的 Begin-End
区域填写代码。
-
合并农产品所有数据文件;
-
对合并后的数据进行去重;
-
过滤价格数据字段为 0 或者小于 0 的数据;
-
转换统计日期时间戳为日期,格式为:
yyyy-MM-dd
,如1646064000000
转换为2022-3-1
; -
清洗后保存文件至
/root/files/result_data.csv
目录下,文件需自行创建。
注意:不要改变字段原本的顺序。
数据集说明
数据集共有五个数据,分别为:2021-11.csv、2021-12.csv、2022-01.csv 、2022-02.csv 和 2022-03.csv,每个数据集一共有9个字段,每个字段的含义如下: