自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (1)
  • 收藏
  • 关注

原创 NACCTBI数据分析日志:2020-10-27

将3个sheet进行重命名:clin, T1, ACBRT1$has_clinical<-在T1中反查是否有clin中的NACCID,是1否0 =IF(COUNTIF(TBI_clinical_data!$A$2:$A$1428,A2)>0,1,0) T1中819行均为1T1$MRI_name_2<-将MRI_name中的.zip去掉 =LEFT(C2,LEN(C2)-4) 如此与ACBR*中名称保持一致便于检索ACBR*$has_T1<-在ACBR*中反查是否有

2020-10-27 21:41:52 119

原创 R语言笔记-变量间相关性评价

文章目录连续变量间相关性计算Pearson、Spearman、Kendall相关系数:``cor(,method="")``相关系数的假设检验与置信区间检验一个相关系数:``cor.test()``检验相关矩阵下的所有相关系数:``corr.test()``偏相关:``pcor()``与``pcor.test()``分类变量间相关性独立分类变量相关性:``assocstats()``配对列联表相关性 (一致性):``kap()``示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子

2020-10-23 23:23:08 5226 1

原创 R语言笔记-用tableStack汇总双变量分析结果

文章目录预处理``tableStack()``用法以紧凑形式呈现:``name.test=FALSE``呈现所有变量的基本信息:``by="none"``呈现多分类变量水平下的结果将输出结果导出到csv文件示例数据:MASS包中的birthwt数据集。预处理将分类变量因子化,具体参考这里为每个变量设置标签:语法为attr(数据框名,"var.labels")<-c(按变量顺序排列的标签名)> attr(birthwt,"var.labels")<-c("low birth w

2020-10-22 22:25:29 2063 1

原创 R语言笔记-连续型变量组间差异比较

文章目录独立样本t检验方差齐性检验 (两组):``var.test()``独立样本t检验:``t.test()``非独立样本t检验单因素方差分析 (ANOVA)正态性检验:``tapply(,shapiro.test)``方差齐性检验 (多组)Bartlett检验:``bartlett.test()``Levene检验:``leveneTest()``建立单因素ANOVA模型:``aov()``事后检验TukeyHSD检验:``TukeyHSD()``其他校正方法:``pairwise.t.test()``

2020-10-22 21:50:31 8372

原创 R语言笔记-分类变量列联表和独立性检验

文章目录频数表与列联表的生成一维频数表二维列联表多维列联表独立性检验χ2\chi^2χ2检验相对危险度 (relative risk, RR)与比值比 (odds ratio, OR)分层情形下的独立性检验:Mantel-Haenszel检验配对列联表的一致性检验:McNemar检验示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子化,具体参考这里。频数表与列联表的生成一维频数表仅展现1个分类变量频数统计语法:table(数据框名$变量名)> table(bi

2020-10-21 22:06:46 11546

原创 R语言笔记-数值型变量的描述统计

文章目录不分亚组的描述统计使用向量操作计算单个变量的描述统计量计算汇总了多个变量的数据框的描述统计量:``sapply()````psych``包:``describe()``分亚组的描述统计``aggregate()````epiDisplay``包:``summ()````psych``包:``describeBy()``不分亚组的描述统计以MASS包中的数据集birthwt为示例。使用向量操作计算单个变量的描述统计量单个变量统计函数计算的基本语法:统计函数(数据框$变量名)关于基本统计函数

2020-10-21 16:55:11 3669

原创 R语言笔记-数据集信息概览

文章目录检查基本信息:``str()``将分类变量因子化:``factor()``对有序分类变量的声明:``ordered=TRUE``变量信息汇总统计基本包:``summary()````epiDisplay``包:``des()````epiDisplay``包:``summ()``以MASS包中的数据集birthwt为示例。检查基本信息:str()留意变量类型:分类变量 (是否因子化),数值变量。data(birthwt,package = “MASS”)str(birthwt)‘dat

2020-10-21 16:24:42 2506

原创 R语言笔记-缺失值的处理

文章目录缺失值的识别缺失值的忽略在计算中忽略缺失值:``na.rm=TRUE``删除变量存在缺失值的个案:``na.omit()``缺失值的识别缺失值表示:NA,代表not availableis.na():返回与输入对象相同格式的对象,其中元素为逻辑值,若原对象该位置为缺失值,返回TRUE,否则返回FALSEtable(is.na()):返回输入对象缺失值与有效值的统计举例如下:> M ID sex age score1 1 1 15 802 2 2 N

2020-10-19 22:07:09 7182 1

原创 MIMIC探索-抽取颅脑损伤患者信息

文章目录颅脑损伤ICD9编码对开放/闭合以及合并颅内损伤的声明对意识障碍的声明FRACTURE OF SKULL (800-804)800 Fracture of vault of skull801 Fracture of base of skull802 Fracture of face bones803 Other and unqualified skull fractures804 Multiple fractures involving skull or face with other bonesI

2020-10-19 10:50:55 763

原创 文献计量学-使用HistCite执行引文分析 (Citation Analysis)

文章目录概述下载与安装文献检索与导入文献列表基本信息引文分析重要指标上层字段指标单篇文献指标寻找开创性文献寻找初始检索后的漏网文献文献选取与标记导出至Endnote新领域引文分析标准流程参考材料概述文献信息分析基于引文的分析 e.g. HistCite基于内容的分析 e.g. refviz,omniviz,Tda分析前沿 e.g. CitespaceHistCite (history of citations):强大的引文分析工具,可使用图谱方式展现某领域不同文献之间的关系;可快速绘

2020-10-19 00:35:56 2988 1

原创 R语言笔记-数据框长宽格式转换

文章目录长格式与宽格式整洁数据集的要求使用基本包进行转换:``reshape()``长转宽宽转长使用``tidyr``包进行转换长转宽:``pivot_wider()``宽转长:``pivot_longer()``长格式与宽格式长格式 (long form):一行代表一次观测,对一个对象不同时刻的观测分布在不同的行之中例如,共有m个对象,每个对象都在n个不同的时刻进行观测,共产生的mn个观测值以长格式记录如下subjecttimepointvalue111t1t_1

2020-10-18 23:52:53 5371

原创 R语言笔记-数据框的合并

文章目录合并个案:``rbind()``合并变量:``cbind()``按标识符合并一般数据合并``merge()``和``full_join()``指定供受体数据框的数据合并:``left_join()``和``right_join()``合并个案:rbind()rbind(数据框1,数据框2):合并数据框1、2的所有行要求合并的数据框必须有相同的变量常用于合并个案合并变量:cbind()cbind(数据框1,数据框2):合并数据框1、2的所有列要求合并的数据框必须有相同的个案常用于

2020-10-18 23:03:20 24838

原创 R语言笔记-用dplyr包处理数据框

文章目录安装``dplyr``包筛选个案:``filter()``和``slice()````filter()````slice()``排列个案:``arrange()``选择特定变量构成新的数据框:``select``增加变量与更新变量:``mutate``增加变量 (计算为新变量)更新变量 (计算并覆盖)计算统计量:``summarise``拆分数据框:``group_by()``传递符:``%>%``将``group_by()``和``summarise()``结合在一起实现分组统计安装dpl

2020-10-18 22:27:30 730

原创 R语言笔记-用基本包处理数据框

查看数据框内容函数解释head()显示数据集前几行tail()显示数据集后几行str()数据集概览attributes()更详细的数据集信息查看des()数据集中变量基本信息查看以epiDisplay包下的Familydata数据集为例:> library(epiDisplay)> data("Familydata")直接输入数据框名称:等价于使用print()函数对于比较大的数据框,会占用很多屏幕head(som

2020-10-18 00:04:09 1298

原创 R语言笔记-获取、导入与导出数据

从内置数据集获取数据内置数据集存在于各个包中基本包datasets中包含各个领域的100多个数据集,可使用data()函数进行查看data(package="datasets")调用数据集到工作空间:data(数据集名称)查看数据集的帮助:help(数据集名称)调用不在内存之中包的数据集时,需要先加载该包到内存之中# e.g.> library(MASS)> data(package="MASS")> data(bacteria)> bacteria模拟

2020-10-17 21:41:55 3181 1

原创 R语言笔记-R的数据结构:向量,因子,矩阵,数组,列表,数据框,数据类型转换

向量 (vector)用于存储数值型、字符型、逻辑型数据的一维数组。建立向量枚举A<-c(1,2,3,4,5)数值序列A<-seq(from=1,to=10,by=2) # 以2为步长,从1起始到10结束同值重复A<-rep("HUAWEI",times=5) # "HUAWEI"重复5次选取向量元素/子集单个元素A[k] # 选取向量A中第k个元素选取部分元素构成的子向量A[子向量序号构成的向量B] # 选取向量A中序号为向量B中元素的向量# e.g.

2020-10-17 19:02:11 4258

原创 R语言笔记-R的安装,包的概念,基本数学计算,对象和工作空间

R的安装安装R安装RStudioRStudio是目前最受欢迎的R语言图形界面编辑器之一包 (packages)包的安装R:程序包->安装程序包,选择镜像,选择包,即可RStudio:右下角Packages->Install加载包到内存中:library()或require()检查内存中是否已加载目标包:search,然后检查packages中有没有更新包RStudio:Packages->Updateupdate.packages()基本

2020-10-17 00:22:57 365

原创 二元Logistic回归

引言搞了若干次这个东西,还是似懂非懂。得啃啃这个骨头了。概述研究分类反应变量与多个因素之间的关系,使用Logistic回归典型例子:疾病的病因 (危险因素)分析按反应变量分类二分类:二元Logistic回归多分类无序:多元Logistic回归多分类有序:定序回归 (ordinal regression)按个案是否经过匹配分类非条件Logistic回归条件Logistic回归二元Logistic回归概述一般线性模型中的一种,即反应变量 (dependent va

2020-10-16 22:58:08 15353

原创 重症医学数据库MIMIC-IV简介

前言继MIMIC-III之后,MIT又发布了全新版本的数据库MIMIC-IV。目前版本为V0.4。本文主要对MIMIC-IV进行简要介绍。引用要求When using this resource, please cite:Johnson, A., Bulgarelli, L., Pollard, T., Horng, S., Celi, L. A., & Mark, R. (2020). MIMIC-IV (version 0.4). PhysioNet. https://doi.org/

2020-10-09 21:59:02 19776 17

原创 《控制论导论》读书:变异度-传输变异度

引言研究一组可能事件是如何通过机器传输的;也即输入处一组可能事件与输出处一组可能事件之间的关系只要机器是确定性的,这一传输过程就是严格可以分析、处理的编码与译码编码即变换编码中的“关键语/密钥”即变换中的参数解码即逆变换;仅一一变换才存在单值的逆变换从变异度的角度理解:一一变换不改变变异度,而单值变换可能减小变异度;要使得编码过程中不损失信息,必须在每一步都采用一一变换示例:机器编码设变换器M,能处于S1,S2,...,SnS1,S2,...,SnS1,S2,...,Sn中

2020-10-09 18:07:24 203

原创 《控制论导论》读书:变异度-度量变异度

引言一批事实/现象先前谈论的是一个机器/系统,现在谈论的是一批机器/系统科学研究给出的命题总是针对一批事实/现象的:可重复性是科学研究的重要特征但对一批事实/现象的断言,对于构成这一批事实/现象的单个个体不见得适用统计学断言回归到个体,有可能毫无意义部分关于“构成比”的断言回归到个体,可以联系到“概率”的概念所有可能的消息:囚犯探视问题要求:探望囚犯时不允许带给他任何信息;但探望者可以给囚犯送一杯咖啡但狱吏怀疑囚犯与探望者在先前就达成过关于传递暗号的约定问题:狱吏怎么做才能避

2020-10-09 01:13:46 215

原创 《控制论导论》读书:机构-黑箱

黑箱的一般定义对于一动力系统具有特定的输出/可观测的状态(但不一定所有状态分量都能被观测到)具有/不具有输入端且该系统内部的运行机制是不允许/不能被观测的称该动力系统为黑箱黑箱的研究方式考虑黑箱可能是含时的(内部性质随时间而发生改变)以表格形式记录试验时间、输入、输出构成的这一串记录,称为该黑箱的“登记表”黑箱的标准表达式假定黑箱具有变换器的性质根据黑箱的登记表,列出黑箱在不同输入条件下输出的情况输出的变化情况据此可以判定系统是不是确定性的并推导出其标准表

2020-10-09 00:52:55 410

原创 《控制论导论》读书:机构-稳定性

引言:不变量对于系统状态的论断恒不成立在特定时间范围内成立恒成立平衡状态对于一动力系统的某一状态及某一给定的变换若该动力系统在该变换下保持该状态离散情形:下一步状态完全等同于此时状态连续情形:各状态分量相对于时间变化率为0称就该变换而言,该状态为该动力系统的1个平衡状态循环圈对于一动力系统的一系列状态及某一给定的变换若该动力系统在该变换下无限地于该一系列状态中呈现有规律的循环称就该变换而言,该一系列状态间的有向连接为该动力系统的1个循环圈稳定域对于某

2020-10-09 00:18:23 211

原创 《控制论导论》读书:机构-有输入的机器

本节提要:确定性机器:给定初值,放任自流有输入的机器:给定初值,观察机器在不同操作下的响应参数作用于同一组原象上的多个变换这一组原象表示该机器的状态矢量这多个变换表示该机器可能具有的多种操作模式(性能)在不同的操作模式下,机器的状态矢量可遵循不同的迹线参数举例:对状态矢量(a,b,c,d)施行可能的变换R1,R2,R3,记为:↓abcdR1R1(a)R1(b)R1©R1(d)R2R2(a)R2(b)R2©R2(d)R3

2020-10-08 23:59:44 121

原创 《控制论导论》读书:机构-确定性机器

确定性机器行为与封闭单值变换相同的那种机器,称为确定性机器(determinate machine)不去关心机器本身的物理实质外界对其不产生积极作用该机器下一阶段的状态,取决且仅取决于该机器当前阶段的状态状态一个系统的“状态”(status)指这个系统中具有确定标志的/可识别的一簇性质/状况的合称一个系统可以具有许多可能的状态迹线一个系统随着时间的推移尽管系统本身实际上是被特定算子所推动的但控制论中不关心该特定算子的物理实质(e.g. 钟表受如何的机械力作用而

2020-10-08 23:49:59 132

原创 《控制论导论》读书:机构-变化

对变化的简单假设变化总是可以分解为有限步骤完成的每一给定步骤中的变化总不是无穷小的离散变化可以连续化,在此并不讨论转移皮肤被晒黑的例子白皮肤受到太阳的作用被晒黑了白皮肤——受到作用的对象——原象/被映元素太阳——起作用的因素——算子——作用素黑皮肤——作用后变成的对象——映象/变换象记为:白皮肤→黑皮肤一个原象在算子的作用下变成映象的过程,称为“转移”变换一批原象在算子的作用下变成一批映象的过程,称为“变换”对于变换本身,只关心该变换可以作用的一批原象有哪些

2020-10-08 23:43:51 118

文献计量学软件HistCite Pro 2.1

文献计量学软件HistCite Pro 2.1,这是一款非常强大的引文分析工具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术大牛,还可以找到某些具有开创性成果的无指定关键词的论文。

2020-10-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除