《R语言与数据挖掘最佳实践和经典案例》阅读摘要

本文是《R语言与数据挖掘最佳实践和经典案例》的阅读摘要,涵盖数据导入导出、数据探索、决策树、随机森林、回归分析、聚类、离群点检测、时间序列分析、关联规则和文本挖掘等多个方面。通过实例展示了R语言在数据挖掘中的应用,包括使用各种函数和包进行数据处理和模型构建,并强调了R在数据挖掘领域的优势及与大数据结合的方法。
摘要由CSDN通过智能技术生成

《R语言与数据挖掘最佳实践和经典案例》阅读摘要

Fly or die.—–sissp

一、简介

数据挖掘
统计学、机器学习、信息检索、模式识别、生物信息学
R CRAN(cran.r-project.org)
《An introduction to R》
《R language definition》
数据集
Iris数据集
Bodyfat数据集
二者都包含在R包中

二、数据的导入与导出

R数据的保存与加载
Save(a,file=“./data/dumData.Rdata”)
Rm(a)
load(“./data/dumData.Rdata”)
Print(a)
CSV文件的导入与导出
从SAS中导入数据
通过JDBC导入与导出数据

三、数据探索

查看数据,以iris数据集为例
维度,dim(iris)
名称,names(iris)
结构,str(iris)
属性,attributes(iris)
特定行数据,iris[1:5,],head(iris),tail(iris)
探索单个变量
单个数值型变量的分布情况可以使用函数summary()进行查看,分别为:最小值、最大值、平均值、中位数、第一四分位数、第三四分位数
平均值、中位数和极差可以分别使用函数mean()、median()、range()获取,四分位数和百分位数可以使用quantile()函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值