记录一次机器学习数据标记处理详细过程;需要的数据格式:日期,星期,平均温度,天气, 假日。
1.网站上下载的原数据字段格式:日期,最高温,最低温,天气,风力风向,空气质量指数,假日,备注,8个字段,如下所示。
2. SQL处理过程。
SELECT substring(日期,1,10) as 日期_标准, substring(日期,12,2) as 星期, (最高温 + 最低温) / 2 AS 平均温度, 天气, 假日, case
when ((最高温 + 最低温) / 2) <0 then '寒冷'
when 0 <= ((最高温 + 最低温) / 2) and ((最高温 + 最低温) / 2) < 10 then '低温'
when 10<= ((最高温 + 最低温) / 2) and ((最高温 + 最低温) / 2) < 20 then '中温'
else '高温'
end as 平均温度_标准
FROM `天气_假日_日期`
3.处理后的字段表,如下所示。