奋起的小鹰-CSDN博客

原创 R语言：单因素方差分析及两两比较

多组独立连续变量的比较分析方法介绍

2023-09-05 11:42:15 1058 1

原创利用R语言把纵向数据变成横向数据并给新变量重命名

临床研究中，常用EDC系统收集数据。一般导出的数据都是纵向数据，但纵向数据对于广大的临床医生来说并不友好。往往需要手动把纵向数据变为横向数据才能进行数据分析。不仅费时费力，而且容易出现复制粘贴错误。

2023-04-24 18:37:51 1251 1

原创 R语言中两种筛选数据文件中不固定个数的最大几个数据的方法

最近做数据处理中遇到了一个筛选数据的问题。有两个数据文件，一个是原始数据文件，每个ID有多条数据，总共有10w条数据；另一个文件是需要挑选的每个ID 对应的数据个数（例如ID为A0001需要挑选5条，A0002需要挑选10条……），需要挑选第一个文件中每个ID最大的前几个数据，总计2万条。

2023-02-24 11:30:34 1004

原创【无标题】R语言对100列字符串进行串联拼接合并

在运用R语言对于较少列数据进行合并时，执行代码较简单运用paste()函数进行拼接即可。当列数较多时，例如100列数据进行拼接合并成一列，再采取上述代码模式书写代码就太冗长了。可以采用循环语句进行执行字段拼接。for()语句执行纵向顺序，内嵌while语句执行每一行的多个字段的数据拼接。...

2022-08-02 14:25:55 1683

无论是药企发起的注册临床研究亦或是研究者发起的IIT研究，当涉及到对患者进行不同干预措施时，不可能完全避免研究对象之间的差异，为保证组间均衡性，提高研究的真实性，控制偏倚，就要采用随机化的手段把研究对象随机分配到不同的研究组，尽可能避免研究者或者研究对象主观愿望或者客观因素的影响，使得研究结果具有良好的可比性。临床研究中，常用的随机化方法主要有四类：简单随机法、区组随机法、分层随机法、动态随机法。...

2022-06-16 10:38:13 3701

原创医学研究中的偏倚及其控制

在进行流行病学研究中，不论采用何种研究方法，都是采用样本来推断总体。有许多因素会影响其准确性使研究结果与真实情况发生偏差。引起偏差的原因包括两个方面，一是随机误差，二是系统误差。其中随机误差是由个体差异、抽样和其他未知原因引起的随机性误差，是无法避免的误差，但可以通过研究设计和统计分析方法减少和控制；系统误差一般是由人为或者测量方法不对引起的误差，即我们所说的偏倚，系统误差是可以减少甚至可以避免。减少随机误差可以提供研究的精准性，减少或避免系统误差可以提高研究的真实性。偏倚是随机误差以外的，可导致研..

2022-04-22 19:04:26 18484

原创 R语言非参数检验

对于连续变量进行检验时，当数据分布状态不满足正态分布，那我们就不能采用t检验或者单因素方差分析来进行分析。此时，就要用到非参数检验的方法来进行分析了。

2022-04-20 16:47:39 2866

原创 R语言单因素方差分析及两两比较

一、导语两个样本均数的比较用t检验，那么多个样本均数的比较应该采用什么方法分析呢？就是接下来介绍的方差分析。方差分析由统计学家R.A.Fisher提出，又称为F检验。是通过对数据变异的分析来推断两个或者多个样本均数所代表总体均数是否有差别的一种统计学方法。二、方差分析思想方差分析的基本思想是把全部观察值间的变异按设计类型的不同，分解成两个或多个组成部分，然后将各个部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义。三、单因素方差分析变异来源完全随机化设计资料的方差分析，变

2022-04-02 18:24:41 5588

原创 R语言重复测量方差分析

一、概念重复测量指的是对同一观察对象的同一观察指标在不同的时间点上进行多次测量。用于分析观察指标在不同时间上的变化规律。这类资料在医学研究中比较常见。在实际工作当中，重复测量资料常被误认为是配对设计或随机单位组设计进行分析，不仅损失了重复测量资料所蕴含的信息，还容易的得到错误的结论。由于同一受试对象在不同的时间点的观测值之间往往彼此不独立，存在某种程度的相关，因此不满足常规统计方法所要求的的独立性假定。使得其分析方法有别于一般的统计分析方法。在临床试验中，对受试者一次用药后，对同一个指标多个时间

2022-03-31 17:44:52 5768

原创 R语言t检验

一、概念t检验又称Student's t检验，是以t分布为基础的统计分析方法。是定量资料分析中最为常见的假设检验方法。二、应用条件1、在单样本t检验中，总体标准差σ未知且样本含量较小（n<50）时，要求样本来自正态分布总体；2、两个小样本均数比较时，要求两个样本均来自正态分布总体，且两样本总体方差相等；如果两个样本方差不等，则用t'检验；3、对于两个大样本（样本数均大于50）的均数比较；在实际应用当中，与上述条件稍有偏差，只有数据呈单峰分布，且近似对称分布，一般影响不大。

2022-03-25 16:34:08 23639 1

原创 R语言分类变量的统计描述

三篇介绍了连续变量的统计描述的R语言相关函数，计算数值的相关统计指标。本文介绍分类变量的统计描述及如何在R语言中实现。不同于连续变量，分类变量的统计描述主要是汇总分类变量各类别例数及百分比。1、table()函数...

2022-03-24 18:17:04 11013

原创 R语言定量资料的统计描述

在统计学中，对定量资料（连续变量或者数值变量）的统计描述主要包括集中趋势和离散趋势两个方面。其中集中趋势包括均数、中位数、众数等指标，离散趋势包括方差、标准差、分位数（以上下四分位数最为常用）、最大值、最小值等指标。这些指标在R语言中都有相应的函数。data<-c(1,2,3,4,5,6,7,8,9,10,11)mean(data) #均值median(data) #中位数var(data) #方差sd(data) #标准差min(data) #最小值

2022-03-22 15:58:16 4341

原创 R语言连续变量正态性检验

在医学统计分析中，对于连续变量我们总是需要了解数据的分布状态，是正态分布数据还是偏态分布数据，只有了解了数据的分布状态才可以进行后续的统计分析工作。正态性检验方法主要包括图示法和假设检验法两大类。图示法包括直方图or核密度图和QQ图orP-P图；常用的假设检验法主要包括Shapiro-Wilk检验（Shapiro检验）和Kolmogorov-Smirnov检验。判断数据是否分布正态，我们通常先做出直方图或者核密度图来整体评估数据是否是正态分布，若数据分布偏态严重或者尖峰，可认为数据不符合正态分布；如

2022-03-21 16:28:30 4881

zsc943290710的博客

原创 R语言：单因素方差分析及两两比较

原创利用R语言把纵向数据变成横向数据并给新变量重命名

原创 R语言中两种筛选数据文件中不固定个数的最大几个数据的方法

原创【无标题】R语言对100列字符串进行串联拼接合并

原创浅谈临床研究中随机化

原创医学研究中的偏倚及其控制

原创 R语言非参数检验

原创 R语言单因素方差分析及两两比较

原创 R语言重复测量方差分析

原创 R语言t检验

原创 R语言分类变量的统计描述

原创 R语言定量资料的统计描述

原创 R语言连续变量正态性检验

原创 R 语言读写数据编码格式

原创 R及RStudio软件安装教程

原创 R语言数据标签、变量赋值、修改赋值

原创 R语言选择数据子集

原创 R语言中数据集合并

原创 R语言给数据集创建新变量

原创 R语言导入数据文件（Excel文件、csv文件导入R）

空空如也

空空如也