R programming
文章平均质量分 97
小果一粒沙
To be brave.
展开
-
R语言--数据挖掘7--预测性建模:线性回归
文章目录预测性建模之线性回归模型假设模型理论结果模型诊断变量选择:案例分析数据描述查看数据基本特征及其分布模型拟合:模型检验:检验残差异常值的检验:自相关性检验:多重共线性的检验:总结参考代码本次报告的主要目的是结合回归分析的理论来对实际mlr数据进行分析,并且分析得到的结果。本次报告的主要内容:介绍原理,介绍回归分析的原理。案例分析,结合mlr.csv中的数据,使用回归模型来拟合。总结,总结回归的效果。参考代码预测性建模之线性回归模型假设随机误差零均值、同方差、正态性,且各个原创 2021-05-10 15:01:08 · 6024 阅读 · 0 评论 -
R语言--数据挖掘6--探索性分类建模分析
探索性分类建模分析本报告的主要内容:对报告使用的iris数据和wine数据做介绍。简要介绍基本判别分析、朴素贝叶斯和k近邻的原理。结合原理进行建模分析。对本次报告的总结。代码以及参考。数据介绍本次报告主要使用两个数据:鸢尾花iris数据和酒wine的数据。鸢尾花iris数据:主要有5个字段变量,150个观测数据。其中前4个变量分别是Speal.Length, Sepal.Width, Petal.Length, Petal.Width,它们是我们主要用这4个变量来进行分析,最后一个原创 2021-05-10 14:43:34 · 655 阅读 · 0 评论 -
R语言--数据挖掘5---探索性聚类分析
探索性聚类分析本次实验报告的内容为:介绍数据。首先介绍数据的状况,数据大体代表的意思。数据分为两个部分,一个是R语言自带的鸢尾花的数据;以及航空公司客户信息的数据air_data.csv介绍原理。主要介绍两种聚类分析的方法,k-means聚类和层次聚类法。案例分析。根据原来来对数据进行实际分析,对得到结果给出合理性的解释。本次的案例分析分为两个部分,一部分是对iris数据的分析;另一部分是航空公司客户信息进行聚类分析;总结。对当前做的事情做一个总结,自我评价一下不足。参原创 2021-04-15 23:05:31 · 2661 阅读 · 0 评论 -
R语言--数据挖掘4---探索性数据降维分析
探索性数据降维分析本报告主要包含以下内容:数据介绍基本原理介绍结合案例数据进行分析最后总结附上代码和参考数据介绍本报告所使用的是洛杉矶街区数据,其中包含每个街区的名字、收入中位数、公立学校API中位数、种族多样性、年龄中位数、有房家庭占比等14项字段,共有110个观测数据。本报告的主要目的是对这个数据的字段(变量)进行分析,并且探索性地尝试使用主成分分析和因子分析等降维方法来对数据进行降维分析。基本原理介绍主成分分析主成分分析是一种降维方法,通过原始数据一系列的线性变换找到对数原创 2021-04-15 22:50:30 · 1002 阅读 · 0 评论 -
R语言--数据挖掘3---关联规则分析
文章目录关联规则分析数据介绍基本原理介绍基本概念:Apriori算法有意义的关联规则案例分析总结反思学习其他同学的代码参考代码这其实跟前面排序是等价的查看分析结果inspect函数逐条查看关联规则by="lift"指定按提升值降序排列。----------5 关联分析结果可视化对关联规则的支持度、置信度和提升值进行可视化关联规则分析本次报告主要包括以下内容:数据介绍基本原理介绍结合理论进行案例分析最后总结附录加上参考和代码数据介绍本次报告所使用的案例数据为购物篮数据,存储在shop原创 2021-04-15 22:43:02 · 4812 阅读 · 1 评论 -
R语言--数据挖掘2--数据理解与准备
数据理解与准备数据理解主要是理解数据,包括分析抽样偏差,数据粒度,数据得精确含义,变量类型,冗余变量,完整性,缺省值,数据链接。这里主要先查看数据,处理冗余变量,进行缺失值的分析等。获取并查看数据:首先读取bankloan.csv文件中的数据为数据框bankLoan,并且使用R语言中的summary(bankLoan)初步查看数据的位置分布特征。library(dplyr)library(purrr)library(xlsx)setwd("D:/lagua/CODING/R-learn/R原创 2021-04-15 21:53:50 · 2402 阅读 · 0 评论 -
R语言--数据挖掘1---缺失值的识别与处理
文章目录缺失值的识别与处理查看原始数据分析缺失值的模式及机制缺失数据模式缺失数据机制分析当前数据处理缺失值插补值的评价总的代码参考第一次作业缺失值的识别与处理总的思路:查看数据,进行分析-> 有缺失值,则我们分析为什么有缺失值->分析缺失值的类型->如何处理这个缺失值,有哪些方法,如何选取这些方法->对插补之后的缺失值进行评价,即看插补的好不好查看原始数据有3个变量(列),21个观测值(行)如上表所示,用户的用电数据存在有缺失值。于是我们先考虑使用R原创 2021-04-14 08:23:17 · 4305 阅读 · 0 评论 -
关于R语言报错:invalid argument to unary operator(一元运算符的无效参数)---ggplot2画图问题--解决Monte Carlo模拟输出
目录背景我的操作(错误解决问题过程:1)查找 2)尝试将画图等过程从函数中移出来3)尝试将+geom_line(aes(y=h_mean-sqrt(h_var))移入到前面的一行中去结果总结背景根据Monte Carlo模拟输出:给定函数 用估计积分值, 其中样本服从[0,1]上的一致分布。做下面工作: (1) 画出上述估计值随原创 2019-01-04 13:13:51 · 18673 阅读 · 1 评论