R语言
文章平均质量分 87
anshiquanshu
这个作者很懒,什么都没留下…
展开
-
R语言:读取数据
主要学习如何把几种常用的数据格式导入到R中进行处理,并简单介绍如何把R中的数据保存为R数据格式和csv文件。1、保存和加载R的数据(与R.data的交互:save()函数和load()函数)a save(a, file = "data/dumData.Rdata") # data文件为当前工作目录下的文件,必须存在rm(a)load("data/dumData.Rdat转载 2016-12-02 22:16:23 · 1468 阅读 · 0 评论 -
R语言︱异常值检验、离群点分析、异常值处理
笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值)异常值处理方法主要有:删除法、插补法、替换法。提到异常值不得不说一个词:鲁棒性。就是不受异常值影响,一般是鲁棒性高的数据,比较优质。一、异常值检验异常值大概包括缺失值、离群值、重复值,数据不一致。转载 2017-08-19 10:39:43 · 5039 阅读 · 1 评论 -
R + python︱数据规范化、归一化、Z-Score
笔者寄语:规范化主要是因为数据受着单位的影响较大,需要进行量纲化。大致有:最小-最大规范化、均值标准化、小数定标规范化数据中心化和标准化的意义是一样的,为了消除量纲对数据结构的影响。1、最小-最大规范化——标准化也叫离差标准化,是对原始数据的线性变换,将数据映射到[0,1]之间,与功效系数法相同。标准化 x-min(转载 2017-08-19 10:37:48 · 2445 阅读 · 0 评论 -
[R语言统计]秩转换的非参数检验
非参数检验(non-parametric test)是相对于参数检验(parametric test)而言的。如果总体分布为已知的数学形式,用参数检验,反之用非参数检验。当总体分布不能由已知的数学形式表达,没有总体参数时,就无法用参数检验,两个或多个正态总体方差不等,也不能用t检验或F检验的参数检验。对于不满足参数检验条件的数据,一是进行变量变换,使其满足参数检验条件,另外就是用非参数检验。转载 2017-04-02 22:24:53 · 14237 阅读 · 0 评论 -
R语言广义线性模型
转载自:http://blog.csdn.NET/lilanfeng1991/article/details/361857391.广义线性模型和glm()函数广义线性模型扩展了线性模型的框架,它包含了非正态因变量的分析。广义线性模型通过拟合响应变量的条件均值的一个函数(不是响应变量的条件均值),假设响应变量服从指数分布族中的某个分布(并不仅限于正态分布),极大地转载 2017-04-01 09:25:25 · 4821 阅读 · 1 评论 -
统计挖掘那些事-与相关的故事
一、理论部分在正式进入讲解推导之前,这里先解释一下相关分析与回归分析的差别(均在线性范畴探讨)。相关分析:研究两个随机变量之间的线性相关关系;回归分析:研究自变量与因变量之间的的线性依联关系;虽然相关分析与回归分析都是研究变量之间的联系,但是具体下来有如下差别:(1)相关分析研究的是两个随机变量的关系,这两个变量之间是平等的,并没有主转载 2017-02-10 15:30:27 · 1310 阅读 · 0 评论 -
R绘制Nomogram图的学习笔记
Nomogram,中文常称为诺莫图或者列线图,简单的说是将Logistic回归或Cox回归的结果进行可视化呈现。它根据所有自变量回归系数的大小来制定评分标准,给每个自变量的每种取值水平一个评分,对每个患者,就可计算得到一个总分,再通过得分与结局发生概率之间的转换函数来计算每个患者的结局时间发生的概率。下图显示的logisitc回归的诺曼图。比如想知道年龄70岁的男性的患病风险,只需要将ag转载 2016-12-03 14:23:23 · 29233 阅读 · 3 评论 -
Logistic、Cox回归之图形化呈现(R语言中绘制Nomogram)
首先什么是Nomogram?简单的说这是一种将Logistic回归或Cox回归图形化呈现的方法,可以让读者从图中很简便地根据预测变量的值得到因变量的大致概率数值。其对于Logistic回归或Cox回归的意义,大概相当于散点图对于简单线性回归的意义。具体的介绍以及作图原理,这里就不详述了,有兴趣的请参照附件中SAS公司的一份文档。下面简单说下Nomogram怎么看。如下图。欲知年龄50岁的女性(转载 2016-12-03 15:16:39 · 24129 阅读 · 2 评论 -
C-index/C-statistic 计算的5种不同方法及比较
前言声明: 所有计算基于R软件,如果有人问其他软件如何实现,请自行Google。评价一个预测模型的表现可以从三方面来度量:区分能力(discrimination): 指的是模型区分有病/没病,死亡/活着等结局的预测能力。简单举个例子,比如说,现有100个人,50个有病,50个健康;你用预测模型预测出46个有病,54个没病。那么这46个覆盖到50个真正有病的人的多少就直接决定了你模型转载 2016-12-02 19:49:48 · 36810 阅读 · 15 评论 -
风险预测模型评价第二弹:NRI的R语言计算
作者:麦子转载请注明:解螺旋·临床医生科研成长平台上期我们介绍了一个诊断或风险预测模型的评价指标,重新分类指数(Net reclassification index)。主要介绍了一些概念和运用,今天我们就来解决一下技术问题,怎么算。想来想去,我觉得计算这个东西还是R比较威武。话说恰好前两天在知乎上看到某位生物学大大发了这么一张图——啊呀啊哟!不服啊不服哎!可转载 2017-12-19 17:01:27 · 17331 阅读 · 6 评论