1.数据预处理
主要包括了重复值处理、缺省值处理、抽样处理、训练集和测试集处理。
2.应用模型
根据要求选择相应的数学模型进行分析。这里主要包括了分类算法,聚类算法,关联分析,回归分析4大类型的模型应用。
3.观察处理结果
在套用相应的数学模型之后会产生相应的处理结果,比如在回归分析中会产生相关系数,而关联分析中则会产生提升度等指标。
4.图形可视化
在R语言中一般使用plot函数来作图,当然还有ggplot包来做出更加精美的图形。
5.预测分析
在R语言中一般使用predict函数来进行数据的预测分析。
数据分析的一般过程
最新推荐文章于 2023-06-18 15:42:24 发布