r语言
小白b2
这个作者很懒,什么都没留下…
展开
-
逻辑回归卡方拟合优度检验 r语言
老师写的代码r语言做逻辑回归时的皮尔森拟合优度检验AZTAIDS <- expand.grid(AZT=factor(c("Yes","No"),levels=c("No","Yes")), Race=factor(c("White","Black"),levels=c("Black","White"))) AZTAIDS <- data.frame(AZTAIDS,Yes=c(14,32,11,12), No=c(93,81,52,43))原创 2020-12-06 10:40:15 · 3396 阅读 · 0 评论 -
r混淆矩阵可视化
plot_table = function(x,xlab='Predicted label', ylab='True label', normalize = F){ library(ggplot2) if(!is.table(x)){ warning('input should be a table, not a ', class(x)) x = as.table(x) } if(!原创 2020-12-01 15:52:22 · 3442 阅读 · 0 评论 -
r语言决策树模型建立 可视化 混淆矩阵 roc曲线
library(rpart)library(rattle)library(rpart.plot)library(RColorBrewer)set.seed(1234) #随机抽样设置种子train<-sample(nrow(d1),0.8*nrow(d1)) #抽样函数,第一个参数为向量,nrow()返回行数 后面的是抽样参数前tdata<-d1[train,] #根据抽样参数列选择样本,都好逗号是选择行vdata<-d1[-train,] #删除抽样行#tdata为训练原创 2020-12-01 11:05:48 · 5610 阅读 · 2 评论 -
r语言生成ar、ma、arma序列
用r语言模拟ar序列,ma序列,arma序列生成一个ar序列xt=0.8xt−1+εtx_t=0.8x_{t-1}+ε_txt=0.8xt−1+εtx1<-arima.sim(n=1000,list(ar=0.8))或者用filter函数e<-rnorm(1000,0,1)x2<-filter(e,filter = 0.8,method = "recursive")method:指定拟合的是AR模型还是MA模型。method="recursive"为AR模型;原创 2020-10-13 19:09:28 · 10906 阅读 · 2 评论 -
处理遮盖绘制问题 ggplot2
处理遮盖绘制问题绘制散点图当数据量很大时,难免会出现点重叠,从而影响看清真实的关系。小规模遮盖绘制小规模的遮盖问题一般通过绘制中空点或绘制更小的点来缓解遮盖df<-data.frame(x=rnorm(2000),y=rnorm(2000))norm<-ggplot(df,aes(x,y))a1<-norm+geom_point()#默认的shapea2<-norm+geom_point(shape=1)#shape=1中空的点a3<-norm+geom_poi原创 2020-09-16 11:00:12 · 1816 阅读 · 0 评论 -
ggplot2 基本图形类型 展示数据的分布
图层叠加总体来说,图层有三种用途一 用以展示数据本身,帮助人们辨识数据的整体结构、局部结构以及离群点等二 用以展示数据的统计摘要。通常在数据层中叠加一些图层以展示三 用以添加额外的元数据、上下文信息和注解。例如:在一些离群点或拐点上加上解释性的标签,并希望它突出显示。一般情况下这种图层是最后绘制的图层。基本图形类型以下是ggplot2图形的基本组合部分。每种几何对象即可独立构建图形,也可组合起来搭建更复杂的几何对象。它们均是二维的,故x和y两种图形属性不可或缺。同时接受colour和size属原创 2020-09-15 20:21:17 · 1122 阅读 · 0 评论 -
ggplot2(二)映射函数 几何对象 统计变换 结合几何对象和统计变换
在默认情况aes(wpg,mt)下用映射函数更改图层属性操作层图形属性结果添加aes(colour=cyl)aes(wpg,mt,colour=cyl)修改ase(y=disp)aes(wpg,disp)删除ase(y=NULL)aes(wpg)library(ggplot2)library(ggpubr)p<-ggplot(mtcars,aes(x=mpg,y=wt))a1<-p+geom_point(colour="darkblue原创 2020-09-13 17:20:45 · 1125 阅读 · 0 评论 -
ggplot2快速入门学习(一) 迈出第一步
如果说qplot绘图的特点是一步到位,那么ggplot2绘图最大的特点就是逐层叠加看上去有点晦涩,简单的理解,就是说最后的结果图,就像是刚开始有一层画板,然后程序是一层一层的画上去的,每一层画不同的部分简单的划分,ggplot2有这么几个要素1.数据层2.美学层3.几何图形层在ggplot2中有几个相关概念数据和映射:将数据中的变量映射到图形属性。映射控制了二者之间的关系。图层:图层的作用是生成在图像上可以被人感知的对象,有四个部分:数据和图形属性映射、一种统计变换、一种几何对象、一种位原创 2020-09-09 18:03:10 · 490 阅读 · 0 评论 -
qplot作图 ggplot学习笔记
set.seed() 的作用是让生成的随机数在下文中保持一致。括号里面的数字是代号,相同数字会得到相同的结果sample(x, size, replace = FALSE, prob = NULL)命令是从x中随机抽取size大小的样本,replace是否放回,prob 设置所要抽取的每个元素被抽取的概率。...原创 2020-09-08 17:19:33 · 355 阅读 · 0 评论 -
感知机理论+r实现 统计学习方法笔记
感知机模型介绍的话:感知机 (perceptron) 类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取 +1 和一 值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。假设输入空间对应全体实数空间,输出空间对应-1,+1.由输入空间到输出空间的如下函数:称为感知机。w和b为参数。w是全值向量,b叫做偏值。w·x是内积感知机模型的假设空间是定义在特征空间中的所有线性分类模型。...原创 2020-08-24 12:00:57 · 514 阅读 · 1 评论 -
r语言中的apply函数族 学习笔记
apply函数家族:上图来自http://blog.fens.me/r-applyapplyapply(array, margin, FUN, ...)作用于矩阵或数组中每一行或每一列的一个margin(margin是作为一个函数的输入,有一个对应的输出,例如均值,方差,也可以是自己写的函数),然后返回值存在一个向量或者数组中。举一个例子:> m <- matrix(c(1:10), nrow=2)> m [,1] [,2] [,3] [,4] [,5][1,转载 2020-08-20 17:49:26 · 837 阅读 · 0 评论 -
把图调出好看的颜色 ggplot2-ggthemes包的使用 学习笔记
ggthemes介绍主要作用是提供一些额外的themes、geoms、scales可以让我们快速画出不同主题、背景和配色方案的图片。它将一些期刊、软件的图表风格进行了整理,做成扩展包,方便地格式化出不同风格的图表。ggthemes 有多种风格的主题,它们给ggplot2提供了接近于媒体图片的效果,这样绘出的ggplot2图形看上去增色不少。ggthemes的官方网址,这里有很多配色方案事先准备install.packages('ggthemes', dependencies = TRUE)libra原创 2020-08-20 16:39:11 · 5604 阅读 · 0 评论 -
使用gganimate包做动态图 r 学习笔记
今天学习一个主要用于绘制动画的ggplot2的扩展包—gganimate包文章目录gganimate包简要介绍先决条件:演示数据集静态绘图核心函数1:transition_*() 按时间添加动态核心函数2:view_*()让视图跟随每个帧中的数据变换核心函数3:shadow():在给定的时间点显示其他时间点的数据(加小尾巴)gganimate包简要介绍几个主要函数transition_()定义了数据应如何散布以及如何与时间相关。shadow_() 定义应如何在给定的时间点显示其他时间点的数据。原创 2020-08-17 14:10:49 · 4513 阅读 · 3 评论 -
r语言遗传算法的实现(应用mcga包和genalg包)
用r语言实现遗传算法遗传算法是一类常见的随机化搜索方法,目前被广泛应用于组合优化,机器学习,信号处理,人工智能等领域。这里以模型参数优化为背景学习遗传算法的r语言实现r语言中常用的实现遗传算法的包有mcga包、genalg包、rgenoud包。其中mcga、genalg包比较简单,上手较快。rgenoud包将遗传算法和衍生的牛顿算法结合起来,可以求解复杂函数的优化问题。这里主要学习mcga包,genalg包的用法mcga包使用字节表示变量,而不是实值,并且基于这些用字节表示的染色体进行经典的交叉原创 2020-08-15 16:58:14 · 5737 阅读 · 0 评论 -
特征构建---特征变换(概念分层、标准化(线性与非线性)、离散化(分箱法))基于r语言
特征变换特征变换是指对原始的某个特征通过一定规则或映射得到新特征的方法。常见的特征变化有:概念分层、标准化、离散化、函数变换以及深入表达。特征变换主要由人工完成,属于比较基础的特征构建方法。概念分层将类别过多的变量通过使用概念分层的变换方法得到类别较少的变量,比如可以将年龄变量“1岁”“2岁”“3岁”…等,变换为更高概念层次的值,如“儿童”“青年”“中年”等,这里通过r语言,使用身体发育数据集,介绍概念分层的用法。...原创 2020-08-10 20:13:09 · 2430 阅读 · 0 评论 -
r语言实现关联分析--关联规则挖掘(Apriori算法) (r语言预测学习笔记)
r语言实现关联分析–关联规则挖掘关联分析:引子:我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联。而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如“由于某些事件的发生而引起另外一些事件的发生”)。 我们的生活中有许多关联,一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划原创 2020-08-08 21:26:26 · 10261 阅读 · 1 评论 -
r语言实现互相关分析和典型相关分析
互相关分析互相关与自相关不同,互相关是指两个时间序列在任意两个不同时刻的相关程度。假设有时间序列 xt 和 yt ,则 xt 在时刻 t 和 yt 在时刻 t+n 的相关即为n阶互相关。公式:重温一下自相关系数的公式:(可以看出与自相关的公式差不多,其实互相关分析就是两个时间序列在不同时刻暴力套上自相关系数的公式…大概可以这么理解)在r中用ccf函数可以计算这里以r中自带的airmiles数据集和LakeHuron(1937-1960年)进行演示。ccf(airmiles,ts(Lak原创 2020-08-07 18:30:32 · 8489 阅读 · 9 评论 -
r语言实现自相关分析和偏相关分析
r语言实现自相关分析和偏相关分析自相关分析为什么要做自相关分析:对数据进行建模前首先要对数据有一个大致的理解,自相关分析可以帮助人们看出数据是否平稳,时间序列是否存在某种变化的趋势。自相关简介:自相关是指同一时间序列在不同时刻取值的相关程度,假设有时间序列xt,t=1,2,3,…,则在此时刻 t 和 t+n 之间的相关即为 n 阶自相关,其定义如下:通俗上说,就是把一列数据按照滞后数拆成两列数据,再对这两列数据做类似相关系数的操作。如下图通过r语言实现自相关分析:在r语言中,可直接使用a原创 2020-08-06 22:56:44 · 20014 阅读 · 1 评论