R语言入门
文章平均质量分 59
分享自己或者身边朋友遇到得一些R语言使用时得初级问题。
统计学小王子
行有不得反求诸己
展开
-
R语言入门——多变量移除
有很多小伙伴在运行程序的时候就想在每次循环结束时提出一些占用内存大且无用的数据或变量,或者仅仅保留一些数据,但是。ls()函数的功能是检测目前R空间中存在的变量名字。现在的目标是保留X,移除AB,可以直接使用如下的命令。所以本文总结一些常用的用法。的语法在删除多变量时候需要和。首先定义三个变量ABX。原创 2024-01-18 11:13:04 · 767 阅读 · 0 评论 -
R语言入门——line和lines的区别
具体解释,line()函数中的参数,x,y可以理解为一个数据点横轴,纵轴,其进行的是线性拟合。Line函数返回的是拟合直线的截距和斜率。X,Y是连接点的坐标向量,type表示类型,有线条类型、线宽、线宽、线宽、颜色、线色等。通俗地讲就是在已有图上加线。首先,从直观上看,lines比line多了一个s,但它们还是有很大的区别的,下面将具体解释这个两个函数的区别。其中,call的意思是调用line(x,y)这个函数。综上就是line()与lines()函数的区别。Iter为迭代次数,默认是1。原创 2023-08-31 15:56:35 · 1532 阅读 · 0 评论 -
人一天坐着可以消耗多少热量——R语言计算代码
一般来说,成人每天至少需要1500千卡的能量来维持身体机能,这是因为即使你躺着不动,你的身体仍需能量来保持体温,心肺功能和大脑运作。本文根据该公式设计代码,实现计算一个人计算自己每天的基础消耗。18- 30 岁 14.6 x 体重(公斤) + 450。31- 60 岁 8.6 x 体重(公斤) + 830。男子 : 基本热量(大卡)= 体重(斤) x 10。女子 : 基本热量(大卡)= 体重(斤) x 9。【人体基础代谢的需要基本热量 简单算法】一天坐着可以消耗多少热量?一天坐着可以消耗多少热量?原创 2023-07-19 12:47:57 · 577 阅读 · 0 评论 -
写一个用r语言分层抽样算积分的代码——chatgpt版
【代码】写一个用r语言分层抽样算积分的代码——chatgpt版。原创 2023-04-17 11:04:11 · 1114 阅读 · 1 评论 -
R语言计算多元积分
在R语言中我们经常使用`integrate`函数计算一元积分,例如:《R语言 【integrate】函数》[^1]. 但是在很多情形下我们需要计算多元积分(如归一化多元概率密度函数,求不规则物体的体积等),本文介绍R语言里的多元积分函数(或多重积分)。原创 2023-03-28 10:17:10 · 1830 阅读 · 0 评论 -
如何考虑三臂非劣效性检验的置信区间问题—— interpret_noninferiority {confinterpret}
置信区间原创 2022-12-29 15:15:50 · 283 阅读 · 0 评论 -
Statistical Analysis of Failure Time Data 2nd第一章学习笔记
目录0引言1、失效时间数据(failure time data)参考文献0引言开始学习生存分析了,选择了Statistical Analysis of Failure Time Data 2nd1这本书来学习。为保证学习效果。会把一些知识点以及总结发出来共同学习。水平有限,发现错误希望评论区及时指正。1、失效时间数据(failure time data)定义:关心的事件发生在已经出现的事件的之前,称关心的事为失效事件数据。主要的应用领域:生物医药研究(biomedical studies)或者产原创 2022-12-28 20:40:43 · 416 阅读 · 3 评论 -
牛顿迭代法实例
之前写过部分关于牛顿迭代的练习代码,今天分享一下。原创 2022-09-27 09:50:30 · 2876 阅读 · 0 评论 -
如何快速使用SCI期刊的配色——ggsci简介
ggsci简介原创 2022-08-14 10:53:08 · 1448 阅读 · 0 评论 -
软件著作申请注意事项
软件著作申请流程原创 2022-08-03 11:16:06 · 424 阅读 · 3 评论 -
分段函数续
之前写过一篇分段函数的`多curve函数`作图方法,但是该方法再多个函数函数段时具有很大的缺点,本文介绍`单个函数`加`单个plot`的分段函数作图命令。原创 2022-07-16 13:08:10 · 235 阅读 · 0 评论 -
R语言入门——包的管理与安装之install_url(一)
R语言不同版本包的管理,包的网页安装原创 2022-03-01 16:28:40 · 1920 阅读 · 2 评论 -
R语言入门——序列数据生成方法汇总
目录题目解答(a) c 函数直接构造(b) 使用for循环(c) while 循环(d) repeat循环(e) 使用seq()函数(f) 使用:函数题目本文以下面的题目为例子,展示R语言中生成向量的几种方式。生成一个序列:(1,2,4,8)解答(a) c 函数直接构造> c(1,2,4,8)[1] 1 2 4 8(b) 使用for循环> A <- c()> for(i in 1:4) A[i] <- 2^(i-1)> A[1] 1 2 4 8原创 2022-02-21 20:36:44 · 2214 阅读 · 0 评论 -
R语言入门——如何用R绘制尺子
本文使用基本的绘图命令plot、rect、segments、text绘制一把长10厘米的直尺。话不多说上教程。1、定义基本单位xcm <- 0.07ycm <- 0.072、首先使用plot绘制一个空白画布plot(0:1, 0:1, type = "n", axes = F, ann = F)3、绘制一个灰色的底作为直尺的影子rect(0 + 0.2*xcm,0 - 0.2*ycm,0.95 + 0.2*xcm,0.15 - 0.2*ycm, col="gray", bor原创 2022-01-08 00:25:49 · 1030 阅读 · 0 评论 -
R语言入门——CV岭参数的选择
CV岭参数的选择0引言1、代码1.1 获取数据函数1.2 岭估计函数1.3 岭估计函数1.4 优化调用2、总结0引言《R语言入门——多元回归交叉验证的实现》中介绍了使用交叉验证的思想使用RMSE衡量一个模型的预测精度,本文使用同样的思想确定岭回归的岭参数。具体的估计如下:β^=(XTX+λE)−1XTY.\hat{\beta} = (X^TX + \lambda E)^{-1}X^TY.β^=(XTX+λE)−1XTY.本文就在于选择一个合适λ\lambdaλ是的交叉验证后的RMSE最小,具体代码原创 2021-10-18 13:18:12 · 1912 阅读 · 0 评论 -
R语言入门——多元回归交叉验证的实现
目录引言1、主要函数编写1.1 随机数据的产生1.2 CV.lm的编写1.2 CV.lm的调用3、数值模拟总结引言随着模型复杂度的提高和数据量的提升,预测精度也会提高,但是使用传统的方法评估模型的精度,模型的泛化能力也会降低。我们这时候就有必要使用划分数据集的方法去评估模型。基本思想是参与评估的数据不去拟合模型。本文以多元回归为例子,构建函数去实现交叉验证建立CV模型评估。下面是本文使用的三个包,大家可以自行载入:# 载入包library(ggplot2)library(data.table)原创 2021-09-30 13:24:12 · 4137 阅读 · 0 评论 -
R语言入门——验证多元回归的参数估计的无偏性
目录引言正文运行结果及其分析总结引言多元回归最小二乘估计具有无偏性,本文使用R语言产生随机数对其进行验证。正文因为代码思路比较简单,下面直接贴代码:# 生成数据的函数getData <- function(n = 200, p = 3, Beta = rep(1, p)){ library(MASS) x <- mvrnorm(n, rep(0, p), diag(rep(1, p))) names(x) <- paste0('x', 1:p) y <-原创 2021-09-25 13:30:08 · 2465 阅读 · 0 评论 -
R语言入门——均差表的制作
目录0引言1、函数构造2、函数的调用3、总结0引言牛顿插值多项式的构造在增加新的点时不需要重新构造插值基函数,但是每新增一个已知插值点都够造的均差是比较麻烦的,根据均差的性质可以构造插值表简单的计算每一阶需要的均差。本文编写函数构造均差表,只需要输入插值点和插值函数值两列就可以输出所需要的均差表。1、函数构造MT <- function(x, y){ n <- length(x) mt <- cbind(x, y) for(i in 1:(n-1)){ m &l原创 2021-09-19 12:38:46 · 1767 阅读 · 1 评论 -
R语言入门——取子集
目录引言1、数据构造取子集subset逻辑索引总结引言取自己在数据处理中是比较常用的,本文介绍两种主要取子集的方式。1、数据构造本文以数据框为例子,所以构造数据框。> Df <- data.frame(+ name = paste0('张三',1:16),+ score = round(rnorm(16,60,3)),+ sex = rep(c('男','女'),8)+ )> Df name score sex1 张三1 58 男2 张三2原创 2021-09-17 20:51:42 · 2028 阅读 · 1 评论 -
R语言入门——不掉包实现FNN(单层感知机)
目录0引言1、数据的构造2、感知机函数的构造3、函数调用4、结果可视化4.1收敛误差4.2参数收敛过程总结0引言感知机是个硬分类模型,是1962年Rosenblatt提出的。在深度学习占有很高的历史地位。他是一个二分类模型,激活函数是一个sign函数。本文使用R语言编写简单的感知器分类。并展示他的收敛过程以及误差收敛速度。1、数据的构造感知机对数据的要求很严格,需要数据本身是线性可分的,因此我们构造的数据需要具有很好线性可分的性质。构造代码如下:# 双分类数据的构造n <- 100 #原创 2021-09-17 20:15:22 · 850 阅读 · 0 评论 -
[]和[[]]的联系与区别——R语言入门
目录引言1、定义2、区别联系3、总结引言不同于左缀函数,[]和[[]]类似于+-*/是用来索引的变量自己的中缀函数。本文来说明一下这两函数的区别与联系。1、定义下面的定义分别来自于这两个函数的帮助文档:'[]''[[]]'根据载体、矩阵、阵列和列表提取或替换零件。下面是具体的使用示例:x[i]x[i, j, ... , drop = TRUE]x[[i, exact = TRUE]]x[[i, j, ..., exact = TRUE]]x$namegetElement(obj原创 2021-09-15 20:46:12 · 2651 阅读 · 0 评论 -
R语言入门——常用函数50个
R语言函数入门50个基本函数0引言1、入门准备操作及函数1.1R版本介绍以及IDE的选择1.2IDE及其常用的快捷键2、空间操作以及纠错函数2.1 ? 、??、help、demo、example2.2 ls()2.3 getwd()、setwd()2.4 其他函数2.5大量数据空间管理3、常用数据结构的创建3.1向量的创建c、scan、rep、seq、:3.2矩阵的创建matrix、as.matrix,diag、data.matrix、cbind、rbind、t3.3 数据框的创建data.frame、as原创 2021-09-05 14:34:34 · 19922 阅读 · 5 评论 -
R语言画词云图——建模常用软件
在数学建模——软件篇介绍了我常用的软件,借着今年的华为杯,想做个LOGO。然后就使用R语言做了词云图,不过最后由于队友做得比较好,就没采用。本文吧效果和代码贴出来记录一下。library(wordcloud2)char <- c("华为杯", "R语言", "Word", "Mathtype", "Latex", "Matlab", "Viso", "Python", "Ligo", "Excel", "QQ", "微信", "腾讯会议", "excel2latex", "网盘", "知网",原创 2021-08-19 09:44:33 · 700 阅读 · 2 评论 -
弹性网惩罚项的可视化分析(R语言)
目录0引言1、函数构建1.1代码1.2图片1.3动图2、总结0引言在博客《变量选择——lasso、SCAD、MCP的实现(R语言》中介绍了R语言做变量选择常用的函数和包,其中msaenet和glmnet是做的弹性网,弹性网是岭回归和lasso类惩罚的回归。下面以二维为例,介绍岭回归、lasso、弹性网惩罚项的区别,因为我们知道惩罚回归是似然函数或者最小二乘求条件极值,具体的形式以限制条件给出,给定常数C有:岭回归,x2+y2=C,x^2 + y^2=C,x2+y2=C,lasso:∣x∣+∣y∣原创 2021-08-15 13:09:28 · 2493 阅读 · 2 评论 -
变量选择——lasso、SCAD、MCP的实现(R语言)
目录0引言1、glmnet2、msaenet3、ncvreg0引言自1996年lasso被提出以来,很多学者针对不同的模型提出有效的算法进行计算,例如多元线性线性模型、cox回归模型、广义线性模型等。也给出了很多选择惩罚参数的方式,比如cv、aic、bic。还有很多惩罚类型:lasso、适应性lasso、弹性网、SCAD、MCP。本文主要介绍下面三个包:glmnet、ncvreg、msaenet。先汇总每个包的主要函数、方法。如下表:函数模型惩罚参数惩罚类型包是否弹性网g原创 2021-08-13 20:55:49 · 14543 阅读 · 3 评论 -
(多元)偏正态分布、正态分布、对数正态分布的随机数的产生(R语言)
目录0引言1、函数名2、示例2.1正态分布随机数2.2偏正态分布2.3对数正态分布写在最后的话0引言最近在看偏正态分布相关的东西,偏正态分布的定义形式还是挺多样的,在偏态分布及其数字特征(R语言可视化)中我介绍的最初的一种定义。在平时做模型做随机模拟的时候的需要产生随机数来检验自己模型估计的有效性,我们可以通过各种分层表示用已知的分布去近似,也可以通过筛法使用均匀分布去生成、也可以用MCMC去采样。但是最为一个专业的统计软件——R语言肯定是有内置函数或者内置包去做的。大家感兴趣原理的也可以自行打开R函数原创 2021-07-24 18:03:00 · 9408 阅读 · 9 评论 -
R语言——水仙花数(向量化运算)
求水仙花数是入门编程同学的基本习题,今天使用R语言来完成这个任务。水仙花数是三位数即从100到999中寻找。其定义是 :x_100,x_10,x_1是数x的百位十位个位数.当 其满足x1003+x103+x13=xx_{100}^3 + x_{10}^3 + x_{1}^3 = xx1003+x103+x13=x时,成数x为水仙花数也称水莲花数。这个任务的主要难点是提取数据每个位上的数据。不过过程还是很简单的,下面直接给出其中一种实现方式的代码。num3 <- function(x){原创 2021-06-20 14:02:11 · 2486 阅读 · 1 评论 -
R语言——符号函数(向量化)
目录引言函数if函数逻辑函数总结引言本文编写的函数是符号函数sgn,符号函数的定义如下:f(x)={1,x>00,x=0−1,x<0 f(x)=\left\{\begin{aligned}1 ,x >0 \\0, x = 0 \\-1, x <0\\\end{aligned}\right.f(x)=⎩⎪⎨⎪⎧1,x>00,x=0−1,x<0R语言内部没有这个内置函数。我们可以通过function、if函数很简单的定义自己的符号函数,因为if函数不原创 2021-05-17 20:38:18 · 2340 阅读 · 4 评论 -
2021华中杯A题思路点播
赛题思路更新中... ...0引言1、数据处理读入2、赛题分析0引言华中杯赛题已于2021年4月30日(今天)晚上20:00发布,下面是发布网址,大家感兴趣的可以下载查看交流。今晚(2021年4月30)看了看A题,感觉还行。因为自己这次没参加,就寻思着从建模手和编程手的角度写份思路把,大家有更好的想法和处理技术欢迎再评论区积极留言呀。本文思路使用的软件是R语言3.6.3版本。编程语言不重要,关键是处理思路。其实大部分工作excel就可以解决。低年级的同学不用太过纠结。思路会持续更新三天,大家可以关原创 2021-04-30 23:31:23 · 25235 阅读 · 42 评论 -
2021美赛数据分析全网首发(R语言 )
目录引言1、统计数据准确性1.1 MCM1.2 ICM2、各个赛题参加人数及其比例2.1 透视图表2.2 分析3、各个题目获奖人数4、各个题目获奖比例5、总结与资源引言北京时间4月23号23点左右,美赛成绩陆续发布,不少参赛选手经历了一场“刮彩票”,有的是O也算没有辜负参赛4天的努力,有的是S也只能下次继续加油。具体查看方式见博文:2021美赛什么时候出成绩?1。今天(北京时间4月24)关于比赛的官方文档统计数据发布。即如下六个文档(pdf):具体文档可以去美赛官网下载观看。在文档中统计分别统计的原创 2021-04-24 21:01:52 · 3359 阅读 · 0 评论 -
R语言可视化——动态心型图
目录引言1、心型图初探1.1 带偏移的两个函数1.2 简单心型图2、改进的心型图3、动态画心型图(gif)4.总结引言再开始学习R语言基础画图得时候划过心型图,但是一直是静态得就把代码仍在角落里积灰了,今天拿出来用新的技术重写了一份。本文包含但不限于下面的函数包和技术:plot函数function方法的S3类、animation函数包、函数的闭包。如有没有讲解到得可自行百度学习。本文用到的心型函数是:这是一个隐式表达式,为了方便编程,把他写为两个函数(注意这不是分段函数)。1、心型图初探1.原创 2021-02-17 23:19:17 · 8645 阅读 · 5 评论 -
R语言可视化赏析——2021美赛C题
目录0引言1、展示部分1.1数据介绍1.2改进图片展示1.2.1 图一 月份 地理分布图1.2.2图二 年份月份直方图1.2.3图三 年份 地理 分布图1.2.4图四月份 地理分布图+颜色标度2、总结0引言前两天做了一个美赛的C题,在数据预处理中使用R语言的ggplot2系统对数据进行了初步的展示。但是针对于时空模型,分面、颜色、大小形状等映射显得比较单调,今晚安装了ggplot2的扩展包对美赛的数据进行改进,做成高大上的动态图。本篇博客在于展示改进主要的四幅图片。虽然也解决了一些bug,但是由于刚刚接原创 2021-02-09 01:23:26 · 1461 阅读 · 0 评论 -
2021美赛C题数据读取
更新中… …今年的数据说大不大,说小不小。为了防止特别批量的数据和不常见的数据文件,本文会在比赛期间,及时公布数据读取方式(R语言)。望及时关注收藏,不迷路。原创 2021-02-04 14:04:52 · 7172 阅读 · 1 评论 -
2021美赛准备——内存管理(R语言)
目录0引言1、内存管理技巧1.1、电脑配置1.2 R版本说明1.3 memory.size1.4 rm()1.5 gc()总结0引言今年的美赛C题由于数据量的原因在2021年1月21日提前15天发布了数据下载方式。详情见文章链接。但是遗憾的是给设置了解压密码,也就是单纯只让提前下载,总的来说就是发了个寂寞。但是唯一的信息是压缩包的大小是633M。但是我们不知道他的压缩方式是什么,所以也很难知道具体的数据大小。下面是我按着体积最小进行压缩的文件前后内存大小:可以看到535M的文件解压后后是3.64G,原创 2021-01-26 19:57:49 · 9340 阅读 · 8 评论 -
R语言入门——如何把字符串转化为可执行的命令?
引言我们都知道计算机的可以接受命令进行一些枯燥的运算。但是这些执行的命令都是人事先根据自己的目的事先构建好的。那么问题来了,计算机语言可不可以根据某种需求自己设计语言进而执行得到达到目的么。当然理论上是可以的,但是仔细想想让计算机根据某种特定的需求进行编程,需要让字符串变成可以执行的命令。这样我们才能使计算机按着某种逻辑进行设计语句了。当然本文不介绍如何实现计算机自编程。单纯介绍两个核心函数:eval和parse。1、parse功能:字符->表达式函数参数:> parsefuncti原创 2021-01-19 22:48:50 · 4892 阅读 · 5 评论 -
Rgui控制台中的字体能调吗?
目录引言方案1、GUI参数修改简介总结引言今天收到一个这个问题。一个同学问我Rgui控制台中的字体能调吗。经常使用rstudio的R语言使用者是不用担心这种问题。但是平时使用Rgui的伙伴有点强迫症的就有点受不了了。今天就统一回复一下。这是R本身的控制台:说是话其实对我来说用多了也还行。方案1、GUI先找到编辑->GUI,如图:参数修改简介先上图:其实个化修改的参数挺多的,其中常用的使用修改有字体(size)、背景色(background)、代码颜色(normaltext原创 2021-01-19 18:59:43 · 2708 阅读 · 1 评论 -
R语言入门——sqrt(0.2)^2和0.2是否相等?
目录描述解决问题总结描述解决问题R语言中数据类型有多种:整数型、逻辑型、浮点型、复数型等等,我们往往要对数据类型做如:判断缺失、判断整数、判断类型等逻辑判断操作。但是再浮点型的数据进行判断时,我们通常会犯错。比如sqrt(0.2)^2是否等于0.2,从逻辑上来说是的。但是我们可以通过R语言的命令来探索一下这个事情。> # identical:判断元素是否相等> identical(0.2, 0.2)[1] TRUE> identical(sqrt(0.2)^2, 0.2)[1原创 2021-01-16 23:24:11 · 3662 阅读 · 1 评论 -
R语言入门——批量读取文件
引言在R语言入门——数据快速读取与查看(含实例代码和参数讲解)中介绍了几种R语言读取外部数据的函数和方法。但是在日常的原创 2021-01-11 20:56:19 · 9198 阅读 · 3 评论 -
R语言入门——删除指定数据
引言在R学习中经常用到的是按着某种逻辑值提取数据集。本文来讲一下利用索引的手法删除数据集合。数据准备> Data 英雄 职业 熟练等级 使用频次 胜率1 后裔 射手 5 856 0.642 孙尚香 射手 5 211 0.103 狄仁杰 射手 5 324 0.204 李元芳 射手 4 75 0.305 安琪拉 法师 5 2324 0.原创 2021-01-11 12:25:44 · 24739 阅读 · 1 评论 -
R语言入门——sqldf包 VS dplyr包
目录引言1、数据构造2、筛选2.1 dplyr::filter基本语法:案例2.2 sqldf:sqldf关键字select、from、where、where3、排序3.1 dplyr::arrange3.2 sqldf:sqldf关键字:order by4、选择列4.1dplyr::select4.2 sqldf::select5、创建新的变量5.1 dplyr::mutate5.2 sqldf::select关键字:as6、分组聚合6.1 dplyr::summarize(group_by)6.2 sq原创 2021-01-09 15:28:18 · 6215 阅读 · 3 评论