![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
文章平均质量分 69
zoujiahui_2018
统计学博士
展开
-
用性能分析工具找到程序效率的瓶颈
R的性能分析工具可以按较高频率(如每隔几毫秒)抽查正在被调用的函数, 因为函数可以嵌套调用, 所以会记录下来正在嵌套调用的各个函数。因为抽查的速度很快, 所以会得到大量的被调用函数的抽样数据, 这样就可以进行概括, 得知哪些函数被调用最频繁, 调用的途径是怎样的。但是, 对比较复杂的程序, 应该将要分析的程序保存为一个R源文件, 并用source()的方法将要运行的函数载入, 并用profvis()函数调用该函数并显示运行后性能分析结果。例18.6 以18.4的程序为例。转载 2024-06-13 22:45:34 · 28 阅读 · 0 评论 -
R语言中的数据重塑
tidyverse系列包中的函数操作都是针对简洁数据框进行的,对于不是简洁的数据,实现需要进行数据重塑。数据重塑主要包括长宽表的转换、拆分/合并列、方形化。长宽表转化最初使用的是reshape2包的melt()和cast()函数,后来又发展到早起tidyr包的gather()和spread()函数,现在tidyr 1.0之后又提供了更加易用的pivot_longer()和pivot_wider()函数。原创 2023-09-28 23:03:53 · 1007 阅读 · 0 评论 -
R语言中实现非参数单指标模型估计的函数mgcv::gam
非参数的单指标模型估计原创 2023-08-17 21:49:57 · 827 阅读 · 0 评论 -
R包编写流程
R包的编写原创 2023-04-18 18:47:40 · 724 阅读 · 0 评论 -
函数中对形参的处理函数
函数中对形参的处理函数原创 2022-10-10 19:32:23 · 104 阅读 · 0 评论 -
R语言中利用hclust实现层次聚类
介绍hclust()函数是stats包中的函数,可以根据距离矩阵实现层次聚类。hclust()使用介绍hclust(d, method = "complete", members = NULL)## S3 method for class 'hclust'plot(x, labels = NULL, hang = 0.1, check = TRUE, axes = TRUE, frame.plot = FALSE, ann = TRUE, main = "Cluster Den翻译 2022-05-06 00:18:20 · 8222 阅读 · 0 评论 -
R语言中利用networkD3创建人物关系网络
介绍人物关系网经常在文本分析中应用,其实质就是一个有边和节点的图,在R中实现图的展示有igraph和networkD3两个包,这里讲解networkD3的使用。forceNetwork()的介绍该函数创建一个D3的JavaScript网络图对象。forceNetwork(Links, Nodes, Source, Target, Value, NodeID, Nodesize, Group, height = NULL, width = NULL, colourScale = JS("d3.翻译 2022-04-28 14:13:29 · 1582 阅读 · 0 评论 -
R语言中实现作图对象排列的函数总结
par(mfrow=c(n,m))基础作图par(mfrowc(n,m))是R基础作图中的函数,只对基础作图函数plot的对象起作用gridExtra::grid.arrange()针对ggplot对象grid.arrange()函数只能用于对ggplot对象进行排布用法# 全部参数grid.arrange(..., grobs = list(...), layout_matrix, vp = NULL, name = "arrange", as.table = TRUE, respect原创 2022-04-22 11:07:31 · 3981 阅读 · 0 评论 -
R语言中实现随机森林建模的包randomForest
文章目录介绍randomForest()的用法参数介绍输出参数介绍randomForest 使用 Breiman 的随机森林算法(based on Breiman and Cutler’s original Fortran code)实现分类和回归。它也具有无监督模式(unsupervised mode for assessing proximities among data points).randomForest()的用法## S3 method for class 'formula'rand翻译 2022-04-21 12:10:31 · 3349 阅读 · 1 评论 -
R语言实现决策回归树的包rpart
介绍rpart包中的rpart()函数可以实现决策树和回归树的建模rpart()的使用方法rpart(formula, data, weights, subset, na.action = na.rpart, method, model = FALSE, x = FALSE, y = TRUE, parms, control, cost, ...)参数介绍formula a formula, with a response but no interaction terms. I翻译 2022-04-21 10:47:00 · 7428 阅读 · 0 评论 -
R语言中实现tex表达的包latex2exp
数学公式的表达latex2explatex2exp包实际上是一种将latex语法转变为expression语句的辅助包,当然也可以直接用expression()这个基础函数,只不过直接用的语法不是tex语法,这就很烦。install.packages('latex2exp')library(latex2exp)具体使用,例如:plot(1,1,main= TeX('$\\alpha^\\beta$'))...原创 2022-04-07 18:54:09 · 1566 阅读 · 0 评论 -
定序回归模型
文章目录什么是定序回归模型构建R语言实现什么是定序回归定序回归的因变量是定序变量,数据类型是顺序数据。比如不满意,一般,满意;不合格,合格,优秀等。模型构建假设因变量是评分,先由单变量回归说起,则普通的线性回归模型为:score=β0+β1×x1+ϵ\mathrm{score}=\beta_0+\beta_1\times x_1+\epsilonscore=β0+β1×x1+ϵ若上式中score不是连续变量,而是分类变量(例如取值为1,2,3,4)。这样等式两边的数据类型不统一,直接进原创 2022-03-31 00:04:08 · 4688 阅读 · 2 评论 -
R语言读取文件乱码的处理
文章目录R语言read.csv乱码问题UTF-8 BOM X.U.FEFFR语言read.csv乱码问题UTF-8 BOM X.U.FEFF可参考:https://blog.csdn.net/ofoliao/article/details/106431217其中需要注意的是,fileEncoding根据参数对整个文件的重新编码,encoding根据参数仅对文件中字符串类型的参数重新编码。...原创 2022-03-30 18:29:03 · 3070 阅读 · 0 评论 -
R语言中作图字体的设置
介绍在R语言中设置字体时需要利用**windowsFonts()**加入到字体库中,例如:windowsFonts(myFont = windowsFont("微软雅黑"))然后在调用时,用family='myFont’的参数实现即可。改变ggplot()中的字体my_theme <- theme( panel.background = element_rect(fill = "transparent", colour = NA), plot.background = eleme原创 2022-03-21 21:53:48 · 15378 阅读 · 2 评论 -
用R语言绘制学生化残差图的函数
residplot<-function(fit,nbreaks=10){ z<-rstudent(fit) hist(z,breaks = nbreaks,freq = FALSE,xlab = 'Studentized Residual',main='Distribution of Errors') rug(jitter(z),col = 'brown') curve(dnorm(x,mean = mean(z),sd=sd(z)),add=TRUE,col='原创 2022-03-16 17:15:40 · 5487 阅读 · 0 评论 -
R语言中刻面图中一些元素修改的方法
介绍在ggplot2中我们可以利用facet_wrap()和facet_grid()绘制出刻面图,但是刻面图中的一些元素(例如:刻面标签,刻面背景颜色等)进行个人化修改却不是很容易,这里将给出一些方法的介绍。对刻面标签的修改如果想改变刻面标签可以直接改变变量中取值的名称,或者利用labeller参数,如下所示:利用labeller对象library(reshape2)library(ggplot2)head(tips)p=ggplot(tips,aes(x=total_bill,y=tip/原创 2022-03-15 21:15:49 · 1448 阅读 · 0 评论 -
R语言中的dplyr包
介绍dplyr是一个常用的用于数据清洗的R包,其中主要的函数有:select() 从数据中选择列filter() 数据行的子集group_by() 汇总数据summarise() 汇总数据(计算汇总统计信息)arrange() 排序数据mutate() 创建新变量mutate()的使用方法mutate(df, new_variable=existing_var的表达式,.keep = c("all", "used", "unused", "none"), .before = N原创 2022-03-13 23:17:16 · 2482 阅读 · 0 评论 -
R语言绘图技巧1:二元隐函数的绘制方法
解决思路在matlab中如果像绘制一个二元隐函数可以利用ezplot(), 但是在R语言中是没有的。如果可以转换为显示表达式可以利用curve()函数绘制,如果不好转换为显示表达只能利用等值线的方法来绘制。举例绘制圆x2+y2=1x^2+y^2=1x2+y2=1, 代码如下:x<-seq(-1.1,1.1,length=1000)y<-seq(-1,1,length=1000)z<-outer(x,y,function(x,y) x^2+y^2-1 )contour(x,y,原创 2021-11-08 16:07:10 · 1258 阅读 · 1 评论 -
R语言中实现随机森林对非线性相依数据拟合的包RandomForestsGLS
文章目录对空间数据的拟合数据生成过程参数说明实现代码和传统RF模型比较对AR(p)模型的拟合数据生成过程参数说明代码实现参考文献对空间数据的拟合数据生成过程参数说明实现代码和传统RF模型比较对AR(p)模型的拟合数据生成过程参数说明代码实现参考文献1.A. Saha, S. Basu, A. Datta. Random forests for spatially dependent data. arXiv. 2021.https://arxiv.org/p原创 2021-10-02 13:12:32 · 624 阅读 · 0 评论 -
R语言中用于计算Rsquare的包rsq
介绍R语言中的req包可以对线性模型和广义线性模型的多种形式的R2R^2R2进行计算函数介绍rsq()的介绍rsq(fitObj,adj=FALSE,type=c('v','kl','sse','lr','n'))参数介绍:fitObj:一个“lm”,“glm”, “merMod”, “lmerMod” 或者类 “lme”; 通常是 lm, glm, glm.nb, lmer , glmer , lme4中的glmer ,nlme中 lme的一个结果。adj:这是一个逻辑值,如果是TRUE原创 2021-09-22 23:05:56 · 12068 阅读 · 0 评论 -
如何用Pycharm运行R语言
文章目录安装插件R Language for IntelliJ创建R项目R脚本头信息试运行安装插件R Language for IntelliJ创建R项目R脚本头信息这一步可以省略,这样显示的就是默认信息试运行原创 2021-08-03 23:22:56 · 3232 阅读 · 1 评论 -
R语言中实现线性回归+l_0范数变量选择的包abess
文章目录模型理论函数介绍实例1:指定稀疏参数sss实例2:不指定稀疏参数sss模型理论该包实现了一种多项式复杂度的算法来利用下面的模型进行最优子集选择:minβ∈Rp12n∥y−Xβ∥22,s.t.∥β∥0≤s,\min_{\beta\in\mathcal{R}^p}\frac{1}{2n}\|y-X\beta\|^2_2, \quad s.t.\quad \|\beta\|_0\leq s,β∈Rpmin2n1∥y−Xβ∥22,s.t.∥β∥0≤s,其中∥⋅∥2\|\cdot\|_2翻译 2021-07-29 17:32:54 · 870 阅读 · 0 评论 -
R语言中进行随机变量运算以及产生混合分布的convdistr包
文章目录进行随机变量之间的运算绘制频率直方图DISTRIBUTION 类可以产生的分布类别进行随机变量之间的运算library(convdistr)library(ggplot2)a <- new_NORMAL(1,0.5)b <- new_POISSON(5)c <- new_BETA(10,20)res <- a + b * cmetadata(res) #> distribution rvar#> 1 CONVOLUTION 2翻译 2021-07-29 12:17:38 · 2416 阅读 · 0 评论 -
R语言中如何利用ggplot2绘制qq图和boxplot图
文章目录绘制qq图函数介绍geom_qq()参数介绍注意事项例子Using to explore the distribution of a variable绘制boxplot函数介绍参数介绍例子利用分位点绘制箱线图将qq图和箱线图进行融合函数介绍参数介绍注意事项例子绘制qq图在ggplot2中绘制qq图需要两步,geom_qq()将绘制样本分位点,geom_qq_line()将绘制标准正态线函数介绍geom_qq()geom_qq( mapping = NULL, data = NULL原创 2021-07-19 16:16:17 · 10397 阅读 · 0 评论 -
利用R语言进行具有周期性的时间序列分析
文章目录读取数据并绘制时序图绘制自相关图和偏自相关图进行季节差分模型拟合读取数据并绘制时序图install.packages("astsa")library(astsa)e1x2 <- ts(scan("C:/Users/l/Desktop/e1x2.dat")) #数据导入plot(e1x2, type="b") #画时序图绘制自相关图和偏自相关图acf(e1x2)pacf(e1x2)通过对相同数据的分析,可尝试S=12为季度周期。进行季节差分#计算月度均值e1x2m原创 2021-07-18 15:10:16 · 7788 阅读 · 1 评论 -
R进阶学习路线
基础字符串处理函数——stringr绘图系统:plot——ggplot2代码风格:函数嵌套——管道函数(%>%)列表处理:list(自建循环)——rlist——data.tablejson处理:Rjson+RJSONIO——jsonlite数据抓取:RCurl+XML——httr+xml2循环任务:for/while——apply——plyr::a_ply——并行运算(foreach、parallel)切片索引:subset——dplyr::select+filter聚合运算:aggr原创 2020-09-03 09:53:00 · 207 阅读 · 0 评论 -
Rstudio中常用的几个快捷键
大纲视图:Ctrl+Shift+O用段落注释来定义分段:Ctrl+Shift+R (在菜单栏中依次点击Code -> Insert Section)。折叠所有代码: Alt+O, Command+Option+O打开所有代码: Shift+Alt+O, Command+Shift+Option+O原创 2020-08-30 09:30:58 · 3165 阅读 · 0 评论 -
R语言中实现广义线性模型lasso的包——glmnet
对于高维的广义线性模型,传统的是没有l1l_1l1惩罚项,有些时候我们需要加入惩罚项就得自己写优化函数。后来发现glmnet可以解决这样的问题。glmnet包在处理具有l1l_1l1和l2l_2l2惩罚项的似然函数问题是非常高效的,可以很好得利用X矩阵的稀疏性。Lasso回归复杂度由参数lambda来控制,lambda越大模型复杂度的惩罚力度越大,从而获得一个较少变量的模型。除了参数lambda,还有参数alpha,控制对高相关性数据时建模的形状。使用Lasso回归,alpha=1(R语言glmn原创 2020-08-10 18:36:40 · 24979 阅读 · 4 评论 -
R语言中常用的抽样函数
简单随机抽样简单随机抽样分为有放回抽样和无放回抽样,这两种形式都可以通过base包中的sample()函数实现。sample(x, size, replace = FALSE, prob =NULL)x: 带抽取对象,若为整数则表示从1-n的整数中抽取,特别注意如果x为数据库抽取的是列而非行size: 想要抽取的样本数量replace: 是否为有放回,默认为FALSE,即无放回pr...原创 2020-04-28 19:08:00 · 10281 阅读 · 0 评论 -
R中因宏包冲突遇到的坑
dplyr与plyr的冲突在做分组计算时,正常情况下使用dplyr就可以,如下:library(dplyr)zou=data.frame(n=rep(c(1,2),10),x=1:20)zou%>%group_by(n)%>%summarise(z=mean(x))# # A tibble: 2 x 2# n z# <dbl> <dbl>...原创 2020-02-19 13:06:58 · 1082 阅读 · 0 评论 -
R语言中查询和分析packages的方法汇总
文章目录前言获取CRAN上package的信息根据packages的信息进行分析,可视化处理使用情况的条形图作者的关系网络图packages的关系依赖图重点!寻找需要的R包对Rpackages的另一种查找方法--packagefinder::findPackage()根据关键词在CRAN上搜索packages的信息获取每个包每月的下载量列出了每个包在其生命周期内的总下载量可视化package下载情...原创 2020-02-18 15:00:25 · 5993 阅读 · 1 评论 -
R语言数据的新类型tibble(dataframe的加强版)
前言**data.frame:**最基本,大多函数的设计基于此种结构;读写速度一般**data.table:**在data.frame上的改进,读写速度最快;加入了索引操作,结合索引数据处理更方便**tibble:**主要在dplyr和tibble包中有效,主要关注于列list,支持整洁格式;数据进行懒加载用法加载可以单独加载也可以通过tidyverse套装进行加载library(p...原创 2020-02-17 22:29:48 · 9757 阅读 · 0 评论 -
R中的字符串处理函数汇总
字符串分割函数:strsplit()字符串连接函数:paste()及paste0()计算字符串长度:nchar()及length()字符串截取函数:substr()及substring()字符串替换函数:chartr()、sub()及gsub()字符串匹配函数:grep()及grepl()大小写转换函数:toupper()、tolower()及casefold()字符(串)的格式化(...转载 2020-02-16 17:47:36 · 219 阅读 · 0 评论 -
R中不得不知的高级包
R语言高效的管道操作magrittr该包在代码简洁的地方效果很好。可以参考:https://blog.csdn.net/kMD8d5R/article/details/82881559R语言学习笔记之——数据处理神器data.tabledata.table在处理大数据的时候优势很大。可参考:https://blog.csdn.net/kmd8d5r/article/details/8...原创 2020-02-16 17:44:56 · 270 阅读 · 0 评论 -
如何利用python或R同时做出多条不同类别的曲线
同时做多根不同类别的曲线python中利用pandas+matplotlibimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltX=np.mat(range(1,21)).reshape(4,5).T#python中矩阵的排列按行df=pd.DataFrame(X,index=range(1,6),c...原创 2020-02-07 13:07:17 · 512 阅读 · 0 评论 -
R中的中文分词Rwordseg包的用法
利用 Rwordseg+rJava进行中文分词参考来源:https://blog.csdn.net/wzgl__wh/article/details/52528925转载 2020-01-30 09:42:41 · 266 阅读 · 0 评论 -
R语言中需要注意的一些易错细节
predict函数predict()使用时,newdata的列名必须和training set的列名相同例如:fit=lm(y~x,data=mydata)predict(fit,data.frame(mydata$x))##这是错误的!!!predict(fit,data.frame(x=mydata$x))##这才是正确的!!...原创 2019-12-10 19:55:17 · 651 阅读 · 0 评论 -
R语言中作图的一些基本代码
文章目录在已有的plot图像中如何添加线条做出三维表面图在指定坐标中做注释标题和xy的标签图例一张图上按类别做出多种颜色的曲线在已有的plot图像中如何添加线条abline(v =1)#添加垂直的辅助线abline(h=1)#添加水平的辅助线lines(x,y)#添加由向量x,y组成的线条做出三维表面图persp(x,y,z,phi=-45,theta=45,col="yellow"...原创 2019-12-09 22:20:05 · 8271 阅读 · 1 评论 -
R语言对文件夹及文件的操作函数
读取指定路径中的全部文件名dir(address,pattern=".XX")或者list.files(address,pattern=".XX")其中pattern支持正则表达删除文件file.remove(address)返回上一级路径dirname(myaddress)查看某一文件夹是否存在dir.exists(address)创建文件夹dir.create...原创 2019-11-23 20:10:25 · 4857 阅读 · 0 评论 -
R语言中的字符串处理函数
尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数。字符串分割函数:strsplit( )字符串连接函数:paste( )计算字符串长度:nchar( )字符串截取函数:substr( )及substring( )字符串替换...转载 2019-11-18 14:02:23 · 2170 阅读 · 0 评论