好了,在前一篇文章中,我们将数据集转化为numeric格式,以便于在实际工作中预测投资者是否再次投资。
不过上次的数据集转化,将时间格式全部转化为了NA,导致预测准确率下降了约5%(因为失去了时间早晚这个维度),我们今天就来讲一下如何将数据集中的时间变量转化为numeric格式。
首先我们先回忆一下将时间变量转化为numeric格式的难点:
因为读入数据集的时候,所有数据都是以factor格式存储,如果直接用as.numeric函数转化时间,会发生一个奇特的现象——时间顺序被打乱,我这边数据集的情况如下:
直接使用as.numeric函数转化时间,出现下图: