r语言与数据挖掘最佳实践和经典案例数据_R语言与数据挖掘最佳实践和经典案例...

本书深入介绍了如何使用R语言进行数据挖掘,涵盖数据导入导出、探索分析、决策树、随机森林、回归、聚类、离群点检测、时间序列分析、关联规则、文本挖掘和社交网络分析等多个方面,并结合实际案例进行详细讲解,适合数据挖掘爱好者和从业者参考。
摘要由CSDN通过智能技术生成

R语言与数据挖掘最佳实践和经典案例

作者:赵彦昌

出版日期:2014年09月

文件大小:24.66M

支持设备:

¥30.00在线试读

适用客户端:

言商书局

iPad/iPhone客户端:下载 Android客户端:下载PC客户端:下载更多详情:查看

?对图书下载、阅读卡购买有疑问:立即进入帮助中心>>

图书简介

目录

本书主要介绍如何使用r工具进行数据挖掘,提供了r用于数据挖掘应用的案例、代码示例和数据,涵盖了最常用的数据挖掘技术。《r语言与数据挖掘最佳实践和经典案例》讲述简洁、内容实用,配有现实应用案例和代码示例以及数据,在线资源丰富,适合数据挖掘方向的研究生、数据挖掘领域的研究人员,以及数据挖掘工程师和分析师阅读。

出版者的话

译者序

缩写词表

第1章 简介

1.1 数据挖掘

1.2 R

1.3 数据集

1.3.1 iris数据集

1.3.2 bodyfat数据集

第2章 数据的导入与导出

2.1 R数据的保存与加载

2.2 .CSV文件的导入与导出

2.3 从SAS中导入数据

2.4 通过ODBC导入与导出数据

2.4.1 从数据库中读取数据

2.4.2 从Excel文件中导入与导出数据

第3章 数据探索

3.1 查看数据

3.2 探索单个变量

3.3 探索多个变量

3.4 更多探索

3.5 将图表保存到文件中

第4章 决策树与随机森林

4.1 使用party包构建决策树

4.2 使用rpart包构建决策树

4.3 随机森林

第5章 回归分析

5.1 线性回归

5.2 逻辑回归

5.3 广义线性回归

5.4 非线性回归

第6章 聚类

6.1 k-means聚类

6.2 k-medoids聚类

6.3 层次聚类

6.4 基于密度的聚类

第7章 离群点检测

7.1 单变量的离群点检测

7.2 局部离群点因子检测

7.3 用聚类方法进行离群点检测

7.4 时间序列数据的离群点检测

7.5 讨论

第8章 时间序列分析与挖掘

8.1 R中的时间序列数据

8.2 时间序列分解

8.3 时间序列预测

8.4 时间序列聚类

8.4.1 动态时间规整

8.4.2 合成控制图的时间序列数据

8.4.3 基于欧氏距离的层次聚类

8.4.4 基于DTW距离的层次聚类

8.5 时间序列分类

8.5.1 基于原始数据的分类

8.5.2 基于特征提取的分类

8.5.3 k-NN分类

8.6 讨论

8.7 延伸阅读

第9章 关联规则

9.1 关联规则的基本概念

9.2 Titanic数据集

9.3 关联规则挖掘

9.4 消除冗余

9.5 解释规则

9.6 关联规则的可视化

9.7 讨论与延伸阅读

第10章 文本挖掘

10.1 Twitter的文本检索

10.2 转换文本

10.3 提取词干

10.4 建立词项-文档矩阵

10.5 频繁词项与关联

10.6 词云

10.7 词项聚类

10.8 推文聚类

10.8.1 基于k-means算法的推文聚类

10.8.2 基于k-medoids算法的推文聚类

10.9 程序包、延伸阅读与讨论

第11章 社交网络分析

11.1 词项网络

11.2 推文网络

11.3 双模式网络

11.4 讨论与延伸阅读

第12章 案例Ⅰ:房价指数的分析与预测

12.1 HPI数据导入

12.2 HPI数据探索

12.3 HPI趋势与季节性成分

12.4 HPI预测

12.5 房地产估价

12.6 讨论

第13章 案例Ⅱ:客户回复预测与效益最大化

13.1 简介

13.2 KDD Cup1998的数据

13.3 数据探索

13.4 训练决策树

13.5 模型评估

13.6 选择最优决策树

13.7 评分

13.8 讨论与总结

第14章 案例Ⅲ:内存受限的大数据预测模型

14.1 简介

14.2 研究方法

14.3 数据与变量

14.4 随机森林

14.5 内存问题

14.6 样本数据的训练模型

14.7 使用已选变量建立模型

14.8 评分

14.9 输出规则

14.9.1 以文本格式输出规则

14.9.2 输出SAS规则的得分

14.10 总结与讨论

第15章 在线资源

15.1 R参考文档

15.2 R

15.3 数据挖掘

15.4 R的数据挖掘

15.5 R的分类与预测

15.6 R的时间序列分析

15.7 R的关联规则挖掘

15.8 R的空间数据分析

15.9 R的文本挖掘

15.10 R的社交网络分析

15.11 R的数据清洗与转换

15.12 R的大数据与并行计算

R语言数据挖掘参考文档

参考资料

通用索引

包索引

函数索引

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值