R语言
文章平均质量分 72
关于R语言的博客
John Zhuang
心如止水
展开
-
R语言与数据分析练习:使用Apriori算法实现网站的关联分析
R语言与数据分析练习:使用ARIMA模型预测网站访问量使用ARIMA模型预测网站访问量一、实验背景:基于某网站的访问数据,使用Apriori算法对网站进行关联分析二、实验目的:预测网站访问量三、实验设计方案和流程图:实验设计方案:由于实验1已对数据进行处理,这里我们只需要根据题目要求取出需要的数据。建立一个列表,每个列表代表一个用户访问的网站,将列表转为数据框,保存到本地。创建网站的二元矩阵,将每一个用户访问的ip改为1,导出二元矩阵。构建关联规则模型,把数据转换成关联规则需要的数原创 2021-06-25 17:57:44 · 9700 阅读 · 10 评论 -
R语言与数据分析练习:使用协同过滤算法实现网站的智能推荐
R语言与数据分析练习:使用协同过滤算法实现网站的智能推荐使用ARIMA模型预测网站访问量一、实验背景:基于实验1中某网站2016年9月每天的访问数据,使用基于内容的协同过滤算法实现网站的智能推荐,帮助客户发现他们感兴趣但很难发现的网页信息二、实验目的:使用协同过滤算法实现网站的智能推荐三、实验设计方案和流程图:实验设计方案:由于实验1已对数据进行处理,这里我们只需要根据题目要求取出2016年9月份的数据。取出数据后,对字段ID的空值进行处理。处理完数据,我们可以构建一个二元型数据。原创 2021-06-25 17:52:18 · 9529 阅读 · 4 评论 -
R语言与数据分析练习:使用ARIMA模型预测网站访问量
R语言与数据分析练习:使用ARIMA模型预测网站访问量使用ARIMA模型预测网站访问量一、实验背景:随着流量的增大,某网站的数据信息量也在以一定的幅度增长基于该网站2016年9月~2017年2月每天的访问量,使用ARIMA模型预测网站未来7天的访问量二、实验目的:预测网站未来7天的访问量三、实验设计方案和流程图:实验设计方案:由于我们获取的原数据文件为sql类型的,因此我们需要将原数据文件导入mysql,再通过R语言中的方法连接mysql进行数据的读取。读取数据之后,对数据进行观察。原创 2021-06-25 17:46:53 · 10507 阅读 · 9 评论 -
R语言与数据分析练习:创建和使用R语言数据集&数据的导入导出
R语言与数据分析练习:创建和使用R语言数据集&数据的导入导出实验一 创建和使用R语言数据集一、实验目的:了解R语言中的数据结构。熟练掌握他们的创建方法,和函数中一些参数的使用。对创建的数据结构进行,排序、查找、删除等简单的操作。二、实验内容:1、向量的创建及因子的创建和查看有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1 以 及他们各自所在地的州名。州名为:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, ns原创 2021-04-07 21:25:24 · 46375 阅读 · 0 评论 -
R语言与数据分析练习:选择适当模型拟合某股票连续若干天的收盘价序列的发展
R语言与数据分析练习:选择适当模型拟合某股票连续若干天的收盘价序列的发展ARIMA模型ARIMA模型(英语:Autoregressive Integrated Moving Average model),差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。“差分”一词虽未出现在ARIMA的英文名称中,却是关键步原创 2021-04-06 21:07:59 · 42347 阅读 · 1 评论 -
R语言与数据分析练习:计算特征间的Pearson相似系数
R语言与数据分析练习:计算特征间的Pearson相似系数Pearson相关系数Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。Pearson相关系数简介如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。其计算公式为:题目:原创 2021-03-23 20:24:40 · 47948 阅读 · 1 评论 -
R语言与数据分析练习:K-Means聚类
R语言与数据分析练习:K-Means聚类题目:在篮球运动中,一般情况下,控球后卫与得分后卫的助攻数较多,小前锋的得分数较多,而大前锋与中锋的助攻数与得分数较少。下表为21名篮球运动员每分钟助攻数和每分钟得分数的数据集,请运用K-Means聚类算法将这21名篮球运动员划分为5类,并通过画图判断他们分别属于什么位置。数据如下:assists_per_minute为每分钟助攻次数points_per_minute为每分钟得分数实现代码:# 切换路径,导入数据setwd('D:/bigdata/R原创 2021-03-19 23:47:28 · 36942 阅读 · 8 评论