本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.17节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.17 总结
本章讨论了以下主题:
数据挖掘和可用的数据源。
R语言的简要概述以及使用R语言的必要性。
统计学和机器学习,以及它们与数据挖掘关系的描述。
两个标准的行业数据挖掘过程。
数据属性类型和数据测量方法。
数据预处理的3个重要步骤。
数据挖掘算法的可扩展性和效率,以及数据可视化的方法与必要性。
社交网络挖掘、文本挖掘和网络数据挖掘。
关于RHadoop和Map Reduce的简短介绍。
在下面的章节中,我们将学习如何使用R语言来处理数据并实现不同的数据挖掘算法。