自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 资源 (2)
  • 收藏
  • 关注

原创 R语言read.csv万能读取各种文件编码的方式

使用R语言读取csv文件的时候,由于文件的字符集不同,有时往往会有乱码。最近整理一个读取csv的方式,足以应付99%的情况。

2023-04-06 16:15:46 979 1

原创 R语言sort,order和rank的区别和联系

排的是原vectro的哪个值(下标)?(是vector哪个index?

2023-04-06 16:02:24 683

原创 4种差异检验

【代码】4种差异检验。

2023-04-06 15:54:14 451

原创 shiny server重启app

shiny server重新启动更新代码后的app

2022-08-31 15:43:20 309

原创 R语言中文字符串排序

设置locale,解决中文字符串排序在各个系统中不一致问题

2022-08-23 17:46:27 840

原创 R Shiny App文件默认加载顺序

描述R Shiny App目录下文件的默认加载顺序

2022-07-22 17:48:13 533

原创 pycharm PyQt5 designer pyuic pyrcc 设置

PyQt5Designer欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入python3.9pycharmpip install PyQt5pip install PyQt5-too

2022-02-15 17:25:51 999

原创 R语言data.frame label的设置

假设dataframe为df <- data.frame(age = c(20, 30, 40), sex = factor(c(1, 2, 1), labels = c("男", "女")) )使用attr设定label属性attr(df[["age"]], "label") <- "年龄"attr(df[["sex"]], "label") <- "性别"也可以使用attr查看label att

2021-10-22 12:01:29 4488 1

原创 R语言data.frame的Encoding(中文乱码解决方式)

查看data.frame的列的字符编码方式使用Encoding函数查看:df %>% select_if(is.character) %>% # 选择是character的列 map(Encoding) %>% # 显示该列的encoding as.data.frame # list整理成表更进一步,采用stringi package的stri_enc_mark函数获取encoding方式librar

2021-10-19 15:48:48 4799

原创 windows获得文件hash值的方式

powershellget-filehash file.csv -algorithm SHA512 | format-listAlgorithm: SHA1 | SHA256 | SHA384 | SHA512 | MACTripleDES | MD5 | RIPEMD160cmdcertutil -hashfile file.csv SHA512Algorithm: MD2 MD4 MD5 SHA1 SHA256 SHA384 SHA512

2021-06-07 12:40:24 458

原创 R语言字符串日期转换和本地设置

使用R语言的as.Date进行日期转换时,需要注意本地设置(locale setting),否则有可能转换失败。> as.Date("01jul2020", format = "%d%b%Y")[1] NA> lc <- Sys.getlocale("LC_TIME") # get the LC_TIME and save it> Sys.setlocale("LC_TIME", "C") # set to C lang default[1] "C">

2021-05-07 09:22:48 849

原创 R语言服务器环境安装全局package

一般个人电脑上安装R的package使用命令install.packages()就可以了,默认安装在个人的home目录下(Windows/Linux)。有时需要在服务器环境安装每个登录账号都能使用的package,该如何做呢?1. 查看当前的package查找路径# Search Paths for Packages> .libPaths()[1] "C:/Users/myhome/Documents/R/win-library/4.0" "C:/Program Files/R/R-4.0.3

2021-05-06 10:55:28 366

原创 R语言命令行执行代码的3种方式(传递参数和环境变量)

大部分情况在IDE环境中运行R程序,但有时也需要在shell中运行,想其他语言的脚本一样。在shell中如何运行R语言的代码呢?为了简化使用,把R/Rscript的可执行路径加入path环境变量。(bash,windows cmd)使用R首先看看R的helpc:\R> R --arch x64 --helpUsage: Rterm [options] [< infile] [> outfile] [EnvVars]Start R, a system for statist

2021-04-21 09:50:31 11874

原创 AWS Redhat Enterprise Server安装桌面步骤

安装EPELEPEL(http://fedoraproject.org/wiki/EPEL) 的全称叫 Extra Packages for Enterprise Linux 。EPEL是由 Fedora 社区打造,为 RHEL 及衍生发行版如 CentOS、Scientific Linux 等提供高质量软件包的项目。装上了 EPEL之后,就相当于添加了一个第三方源。和rpmfusion.org的相比较的话,rpmfusion 主要为桌面发行版提供大量rpm包,而EPEL则为服务器版本提供大量的rpm包

2021-03-10 11:12:53 282

原创 Bioconductor设置清华大学的镜像

在Home目录下增加/修改.Rprofile文件,在文件最后加上镜像设置:options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")再次打开RhuoRStudio即可生效。

2021-03-10 08:34:42 2654

原创 Shiny server的app目录映射规则

shiny sever配置成site host模式之后,在site根目录下可以deploy多个app,每个app一个目录。+---/srv/shiny-server| +---shinyApp1| +---server.R| +---ui.R| +---shinyApp2| +---app.R| +---www| +--- a.html| +---assets| +---style.css|

2020-07-14 22:44:42 1298

原创 R Shiny App增加对百度统计的支持

方法很简单,在百度统计的代码存放在一个js文件中,比如baidu_stat.js,var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?XXXXXXXXXXXXXXXXX"; var s = document.getElementsByTagName("script")[0]; s.parentNode.ins

2020-07-05 17:51:27 234 2

原创 缺失值的插值处理

缺失值根据情况可以删除对应的行或者列,但是在需要尽量保持原始数据的情况下,可以使用插值的方式进行处理。使用mean/median/mode数进行插值library(Hmisc)impute(vector_data, mean)impute(vector_data, median)impute(vector_data, 100) # 直接赋值# 不使用函数vector_data[is.na(vector_data)] <- mean(vector_data, na.rm = T)

2020-06-23 23:23:06 1498

原创 多重检验的p值校正:FWER和FDR

先回忆一下假设检验的来两类错误(参考:深入理解假设检验的两类错误和功效):对于多重检验来说,假设做了m次test,V是假阳性的次数,S是真阳性的次数,R是V+S。 列表如下:H0H_0H0​ Do not reject H0H_0H0​ Reject H0H_0H0​TotalTRUEU V m0m_0m0​FALSE TSm−m0m-m_0m−m0​Totalm-RR mFWER: Family-wise error rateFWE

2020-06-23 22:50:15 7487

原创 R语言如何删除数据集中指定的行或列?

按索引删除只是最基本的删除方式,比如:删除第1到10行:df[-c(1:10),]删除第5到10列:df[,-c(5:10)]按名字删除无论行列,可以找出对应索引或构造相同长度TRUE/FALSE的向量,把不需要的行/列删除index-which(colnames(df) %in% c("a","b"))-grep("a|b",colnames(df)T/F vector!colnames(df) %in% c("z","u")!grepl("a|b", colnames

2020-06-06 21:50:04 132179 1

原创 R语言自动设置当前文件的路径为工作路径

在R文件的前面添加一行语句:setwd(dirname(parent.frame(2)$filename))这样,每次点击RStudio的Source按钮的时候,都会自动setwd到当前执行文件的路径。注意:需要Source该R文件才有效,在RStudio中run the current line没有效果。另:SAS程序自动设置当前执行文件的工作路径:https://blog.csdn.net/ofoliao/article/details/99574853...

2020-05-29 21:19:55 2966

原创 R语言read.csv乱码问题UTF-8 BOM X.U.FEFF

若使用R语言调用data <- read.csv("dataset.csv")文件出现了乱码,解决的方法简单整理如下:查看R语言运行环境的区域(locale)设置> Sys.getlocale(category = "LC_ALL")[1] "LC_COLLATE=Chinese (Simplified)_China.936;LC_CTYPE=Chinese (Simplified)_China.936;LC_MONETARY=Chinese (Simplified)_China.93

2020-05-29 19:25:52 15796 1

原创 R语言如何删除数据集中包含缺失数据NA的行?

请看stackoverflow大神们的花样操作:https://stackoverflow.com/questions/4862178/remove-rows-with-all-or-some-nas-missing-values-in-data-frame

2020-05-04 11:02:48 54804

原创 nnet::multinorm的预测概率计算

及系数p值计算

2020-02-29 23:38:39 434

原创 RStudio效率提升快捷键

快捷键功能alt -快速输入赋值符合 <-ctrl ↑在console快速调出历史输入命令。若输入了前缀,则过滤出带前缀的命令。alt shift K调出快捷键快速参考...

2020-02-19 07:44:24 360

原创 R语言统计基础函数备忘

记录一下R语言常用的基础函数,备忘。持续更新描述性分析函数说明table()计算频数margin.table()计算边沿频数prop.table()计算相对频率,频数比例cut()用于连续数据分组max(),which.max()最大值,最大值的下标mean(), weight.mean()均值,加权平均数概率模拟函...

2020-01-12 10:41:12 595

原创 R语言ggplot2要素总结

ggplot2基础定义数据(data),创建空图(plot object)。ggplot()指定几何图形(geoms – graphics shapes)展现数据。geom_xxxx()指定几何图形的特征(aesthetics – features)表现数值。aes()表示增加图的组件(或图层)geom & aes常用geom以及aes如下表,许多geom还是有colo...

2019-12-30 23:42:00 927

原创 R语言base graphics绘图设置

绘图区域(plotting regions)inner region = figure regiondata symbols and lines -> plot regionaxes and labels -> figure margins or outer marginsThe size and location of the different regions: ...

2019-12-30 23:39:25 1186

原创 R语言base graphics: low level绘图函数

FunctionDescriptionpoints()Draw data symbols at locations (x, y)lines()Draw lines between locations (x, y)segments()Draw line segments between (x0, y0) and (x1, y1)arrows()Draw ...

2019-12-30 23:37:03 455

原创 R语言base graphics: high level绘图函数

R语言base graphics: high level绘图函数单变量high level绘图函数两个变量high level绘图函数多变量high level绘图函数特定图形绘图函数 Specialized plots本文是R Graphics的笔记。R语言base graphics绘制图形的方式:首先使用high level绘图函数参数产生一个新的图形,然后使用low level绘图函数添...

2019-12-28 19:36:24 580

原创 R语言元编程metaprogramming基础函数

R语言元编程基础函数substitute替换函数。形式substitute(expr, env),表达式expr中的变量使用env中的绑定的变量的值(若是函数参数,可能因为promise的缘故还没有eval)替换,env不进行回溯,只在当前的env中搜索。而且env不能是.GlobalEnv,如果是.GlobalEnv,不进行替换。env可以是list。A promise捕获(captur...

2019-12-10 11:39:49 892

原创 R语言面向对象之R6 class

R语言面向对象之R6 class类定义class declaration对象创建object creation对象初始化和终结处理object initialization and finalizer对象打印输出print对象克隆clone类动态修改继承Inheritance访问控制 controlling access(本文是AdvancedR的R6章节的整理)R6是R语言和现在OOP语言比...

2019-12-05 18:55:18 3967

原创 分位数与QQ图

QQ图基本知识Sample Quantiles 样本分位数quantile(x, ...)给定一个系列xxx,可以求出给定累积概率ppp对应的分位数。计算分位数有9种方法1^11:假设方法iii(1≤i≤91 \le i \le 91≤i≤9),对应概率p的计算公式是:Q(p)=(1−γ) xj+γ xj+1,Q(p) = (1 - \gamma)\ x_j + ...

2019-12-04 17:54:35 2407

原创 CDISC标准介绍

CDISC(Clinical Data Interchange Standards Consortium)临床数据交换标准协会就如何收集数据、收集什么类型的数据以及如何将数据提交给负责审批新药的机构建立起了一套标准。涉及临床研究电子数据的获取、交换、存档、提交的全过程。下表是CDISC的细分标准[1]:StandardDescriptionStudy Data Tabulat...

2019-11-26 13:12:41 15066 4

原创 SAS数据步过程步边界

Step BoundarySAS编程中,当跨过step boundary时,提交的代码会被触发执行。那么SAS的step boundary有哪些?有:DATA statementPROC statementQUIT statementRUN statementThe single semicolon ; statement following a DATALINES statemen...

2019-11-24 10:31:06 690

原创 深入理解假设检验的两类错误和功效

进行假设检验时,由于数据的随机性,所作出的决策可能会有:第 I 类错误(拒真):H0H_0H0​为真时错误地拒绝了零假设。第 III 类错误的最大概率记为 α\alphaα。第 II 类错误(受伪):H0H_0H0​为假时错误地没有拒绝零假设。第 IIIIII 类错误的最大概率记为 β\betaβ。H0H_0H0​Do not reject H0H_0H0​Reject H0H_...

2019-11-18 13:19:41 2038

原创 R语言面向对象之S3 class

S3类是R语言中最基础的类设计,是居于object+attribute的方式构造的。构造方法代码一步构造o1 <- structure(data, class = "ClassA")显式设置o1 <- data; class(o1) <- "ClassA" 和类相关的几个函数: typeof(obj) attribute...

2019-11-16 20:25:57 1328

原创 Bootstrap重抽样方法

Bootstrap重抽样方法非参数重抽样 Non-parametric resampling此方法不假设数据的分布或模型。数据表示为n个独立观测向量yobsy_{obs}yobs​, 假设求参数的参数θ^(yobs)\hat{\theta}(y_{obs})θ^(yobs​)的置信区间,非参数bootstrap抽样的步骤如下:从yobsy_{obs}yobs​中不放回的重抽样nnn次,得到...

2019-11-10 18:35:47 11894

原创 Bootstrap词的起源

在计算机学和统计学科中,经常可以看见Bootstrap这个词。此外,还有动名词的形式Bootstrappping,在计算机学科中简写成Booting。Bootstrap这个单词本意是靴子的鞋带。在19世纪早期美国的出现一个短语,“pull oneself over a fence by one’s bootstraps”,意思是“通过拉自己的靴子上的鞋带,把自己提起来越过栅栏”,起初是指荒谬的不...

2019-11-01 20:49:19 1517

原创 R语言绘制叠加图形

使用R语言我们比较常用的在幅图上绘制多个图形,使用par(mfrow)layout()就能够在一幅图上绘制(排列)多个图形。比如:DoseFinding包中的biom数据,我们在一幅图上输出biom数据集的箱线图和散点图:(先install.packages("DoseFinding"))library(DoseFinding)data(biom)par(mfrow = c(1...

2019-10-29 20:19:10 12295

SAS cheat sheet-170401221255.pdf

Dr. Ali Ajouz 的SAS cheatsheet, 简洁明了,强烈推荐。

2019-06-12

SAS cheat sheet.rar

SAS语法,使用技巧。 三份不同文档,速查sas的基本用法

2019-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除