最低日温度
该数据集显示了一个强大的季节要素,并有一个很好的,细致的细节工作。
本教程假定数据集位于当前工作目录中,文件名为 “ daily-minimum-temperatures-in-me.csv ”。
注意:下载的文件包含一些问号(“?”)字符,在使用数据集之前必须将其删除。在文本编辑器中打开文件并删除“?”字符。也删除该文件中的任何页脚信息。
规范时间序列数据
规范化是对原始范围的数据进行重新调整,以使所有值都在0和1的范围内。
标准化可能是tve 有用的,甚至在一些机器学习算法中,当你的时间序列数据具有不同尺度的输入值时,也是必需的。对于某些算法来说它是必需的,比如使用距离计算和线性回归以及人工神经网络来衡量输入值的k-最近邻居算法。
标准化要求您知道或能够准确估计最小和最大可观测值。您可以从您的可用数据中估计这些值。如果您的时间序列呈现上升趋势或下降趋势,那么估计这些预期值可能会很困难,并且标准化法可能不是用于解决问题的最佳方法。
一个标准化的值如下:
y = (x - min) / (max - min)
最小值和最大值与规范化的值x有关。
例如,对于温度数据,我们可以猜测最小和最大的可观测值为30和-10,这会极大高估或低估观测值。然后,我们可以像18.8那样规范化任何值,如下所示:
y = (x - min) / (max - min)
y = (18.8 - -10) / (30 - -10)
y = 28.8 / 4