在做机器学习的时候,首先面对的问题不是模型,而是数据和特征,在实际操作的过程中,我们发现,在数据和特征上花费的时间要远大于在模型上花费的时间,所以,这一节我们来总结一下数据和特征需要的事情
数据上面临的问题以下几个:数据采集、数据格式化存储、数据清洗、数据采样
数据采集
数据采集我们首先要考虑几个问题,我们有哪些数据,其中哪些数据对最后的结果预测有帮助,线上实时计算的时候我们能
在做机器学习的时候,首先面对的问题不是模型,而是数据和特征,在实际操作的过程中,我们发现,在数据和特征上花费的时间要远大于在模型上花费的时间,所以,这一节我们来总结一下数据和特征需要的事情
数据上面临的问题以下几个:数据采集、数据格式化存储、数据清洗、数据采样
数据采集
数据采集我们首先要考虑几个问题,我们有哪些数据,其中哪些数据对最后的结果预测有帮助,线上实时计算的时候我们能