自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

转载 结构方程模型二-R实现

其实有些时候,我们将SEM想的过于复杂了,其实操作起来还是较容易上手的,不过建模过程中需要我们根据自己试验设计等自行建立一个因子间的关系模型,然后对这个模型进行反复调试,直至达到自己满意的结果为止,这就是SEM的难点,因为构建这个关系模型需要丰富的经验,但是有没有什么入门比较快的法门呢,当然是有的——借鉴前人的文献!!!一般建模前,我们会通过一些相关性分析、VIF、CCA/RDA等筛选一下用于建模的因子,去除不必要的因子,使得起始模型的建立更简单一些,也可以通过相关性结合研究实际初步评估一下直接作用和间接作

2021-11-17 23:44:48 5269 4

转载 ICC分析的R实现

intraclass correlation coefficient (ICC)中文叫做同类相关系数。为什么要做icc呢。比如在标注的过程中,我们要衡量这个人标注的怎么样,我们可以这样做:1.从总体样本中选择N个样本。每一个样本都由两个人标注,然后检查两个人标注的差别有多大。2.还是N个样本,一个人标注完了,第二天再让他标注一次,检查两次标注的差别有多大。上面1过程就是组间差异性,2就是组内差异性。icc可以用来衡量这种差异性。计算公式如下,比较复杂这个过程可以用R语言实现。工具包:irr

2021-11-16 16:03:32 3907 1

原创 NHANES数据库的介绍及使用(二)

前一篇介绍了NHANES数据库的加权及数据的下载NHANSE数据库的介绍及使用(一)_Christina-CSDN博客,这一篇主要介绍数据库如何导入软件进行下一步计算合并。例一:以NHANSE数据库的文章为例(Brody DJ, Pratt LA, Hughes J. Prevalence of depression among adults aged 20 and over: United States, 2013-2016. NCHS Data Brief, no 303. Hyattsvill

2021-11-12 22:27:02 17479 45

原创 NHANES数据库的介绍及使用(一)

一、数据库概况NHANES(National Health and Nutrition Examination Survey)是一项旨在评估美国成人和儿童健康和营养状况的研究计划,计划始于20世纪60年代初期,是一项针对不同人群或健康主题的调查。1999年该调查成为一项持续计划,涉及各种健康和营养测量,项目每年调查一个全国代表性的样本,约5000人,这些人群位于全国各县,每年对其中15个县进行访问。NHANES访谈部分包括人口统计学、社会经济学、饮食和健康相关问题。体检部分包括生理测量、实验室检查等

2021-11-12 22:00:43 32990 14

原创 nonnegative matrix factorization (NMF)的R实现

非负矩阵分解(NMF)是一种最新的特征提取算法,与主成分分析(PCA)或独立成分分析(ICA)类似,非负矩阵分解(NMF)的目的是使用有限的基础成分来解释观察到的数据,这些成分组合在一起时尽可能准确地接近原始数据。换句话来说,NMF是一种降维方法。NMF的显著特点是,代表基础成分的矩阵以及混合系数矩阵都被限制为非负项,并且没有对基础成分施加正交性或独立性的限制。当有许多属性,并且这些属性是模糊的或具有较弱的可预测性时,NMF是有用的。通过组合属性,NMF可以产生有意义的模式、话题或主题。无标签的文档或

2021-11-12 21:04:02 2273

原创 多分类RandomForest回归及ROC曲线绘制

require(multiROC)data(iris)head(iris)set.seed(123456)total_number <- nrow(iris)train_idx <- sample(total_number, round(total_number*0.6))train_df <- iris[train_idx, ]test_df <- iris[-train_idx, ]rf_res <- randomForest::randomFores.

2021-11-12 20:59:24 6946 3

原创 分割数据集为训练集,测试集及验证集的R实现

Using ‘splitTools’ (r-project.org)IntroductionsplitToolsis a fast, lightweight toolkit for data splitting.Its two main functionspartitionandcreate_foldssupport data partitioning (e.g.into training, validation and test), creating folds f...

2021-11-12 20:47:48 7340 2

转载 ISME:微生物网络构建与分析面临的挑战

摘要微生物网络作为当下一种流行的数据分析方法被广泛应用于微生物群落研究。虽然目前已有许多并不断有新的微生物网络构建方法被开发出来,但与数据预处理、混杂因素、网络评估和解释相关的多个问题仍未得到足够的重视。因此,本文的目的是呼吁研究者们关注微生物网络构建和分析中这些悬而未决问题。编译:鞠志成英文标题:Open challenges for microbial network construction and analysis中文标题:微生物网络构建与分析面临的挑战期刊:ISME

2021-11-12 20:20:28 1548

原创 R实现一次性合并多个数据框

数据处理中经常会有这样的情况,需要合并多个数据(按行或者按列合并),常规的merge或者rbind只能两个两个合并,操作繁琐。可以使用自写函数或do.call()函数进行数据库的拼接或合并,具体操作如下:按列合并mypath<-"C:/Users/18896/Desktop/example1"multmerge = function(mypath){ filenames=list.files(path=mypath, pattern = ".XPT",full.names=TRUE)

2021-11-10 09:54:54 28958 2

test_lAUu6dG.csv

test_lAUu6dG.csv

2021-08-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除