- 博客(11)
- 收藏
- 关注
原创 MAGMA|基因分析Gene-set analysis|基于原始数据或GWAS结果
目前做gene的全基因组关联分析的方法中存在两个问题:第一,大多数方法的统计能力会受到marker之间连锁不平衡的影响(本方法是先将每个marker的关联性汇总,然后再将其聚合为gene或gene-set),marker间的相互作用也很难被检测出来;第二,依赖排列(permutation)来计算p值的计算方法的计算量十分巨大。
2025-05-16 14:02:41
670
原创 ADHD-200数据库下载
介绍所使用的各个Atlas、time course extraction和一阶处理如Reho、fALFF等内容。根据NIAK标准预处理的流程和各站点质控的结果,其中包含各站点T1和rsfMRI图像质量较差的参与者名单。<site> fmri data为训练集的rsfMRI数据,为nii.gz格式。会具体介绍各站点的数据量、核磁采集参数、临床评估使用的工具等。根据Athena标准处理的流程,此网页也有数据下载的直接链接。部分站点下载下来的压缩包中会包含表型的csv文件。数据为公开免费的,可直接下载使用。
2025-04-15 14:45:54
1606
原创 chr:pos向rsID的转化|R语言|dbSNP数据库
我们有时候下载到的数据没有rsID,只有染色体编号和物理位置chr:pos。这时候需要将chr:pos转化成rsID,便于后续分析。由于我的数据有100万+SNP,因此采用R批量转化的方法chr:pos:Chromosome (Chr) and position (Pos) 染色体和编码位置,利用染色体编号和物理位置确定SNP。rsID 是 dbSNP(NCBI子数据库)的Reference SNP ID,是一串编码变异的数字,唯一确定。
2025-03-18 16:49:40
929
原创 利用liftOver基因组坐标版本转换
后续分析我仍然需要PLINK二进制格式的bed文件(用于计算GWAS,PRS等),因此我后面会用ped/map转换得到bed(较为繁琐,不知道有没有人知道简便一点的方法555)dbSNP数据库(https://www.ncbi.nlm.nih.gov/snp/):可以通过位点的SNP_ID,查询其所在的GRCh37或38坐标位置。我手头的原始文件是 PLINK 的二进制 .bed 文件,而不是文本格式的 BED 文件。# .bed 文件中的坐标是 0-based,而 .bim 文件是 1-based。
2025-02-28 16:31:00
1949
原创 VBM和SBM分析|平滑|统计分析|结果可视化|CAT12工具包
利用surfact tool里面的Resample & Smooth Surfaces功能进行平滑(其他指标如lh.gyrification.*和lh.depth.*文件,也同理)。我自己试的时候,把lh.thickness.*文件单独放在一个文件夹跑会报错,提示似乎是找不到lh.central文件,因此还是在原来的surf里跑。点击SPM工具箱的smooth功能,导入mwp1*开头的文件,FWHM参数可以选[6 6 6] 或[8 8 8]可以创建多几个module,同时并行跑,节省时间。
2024-11-27 21:15:55
1419
原创 基于ROI的VBM和SBM分析|指标值的提取|CAT12工具包
利用CAT12工具包进行VBM和SBM分析,基于感兴趣的ROI图谱进行指标的值的提取:主要内容:1. 原始文件的准备2. 预处理CAT12 segment:配准、分割、标准化、调制;ROI图谱的定义。3. ROI结果提取:基于VBM的灰质体积,基于SBM的皮层厚度、沟深、皮层褶皱等。使用预处理dicom转格式+reorient头动矫正后的T1像(我用的是RESTplus进行预处理,因此选择预处理后STRUCHC文件夹下,每个人的co前缀的nii文件)
2024-11-09 21:37:15
2554
2
原创 利用基因名得到对应的SNP列表|R语言批处理|小白教程
跑通路PRS分析的时候,往往需要对目标通路基因的SNP进行筛选,把base数据集(即GWAS结果)中所需的SNP找出来,再进行PRS的计算。但是文章当中往往只提供基因的名字/列表,而没有提供具体的SNP列表。现有的平台例如dbSNP, GeneCards和NCBI的Variation Viewer等等似乎只能单个基因挨个进行查找,比较耗时,这里我用R中的biomaRt包尝试了一下批量的查找。*如何通过基因名得到对应的SNP列表,需要通过基因所在的染色体位置进行查找。
2024-11-04 16:17:42
1047
原创 批量进行相关分析并生成相关矩阵的热图|R语言
3. 通过循环语句,做批量的偏相关分析,加入sex,age,group作为协变量,同时每一次循环时对缺失值做删除(无论是x、y矩阵变量还是协变量中的缺失值都删除)4. 有需要的话可以做p值校正(例如FDR法),得到校正后p值的矩阵(p_FDR_matrix),以便在热图绘制时进行显著*号的标注。5. 热图中标签的定义,要求pFDR<0.05的小格标注*号,储存在label_matrix标签矩阵中。热图中每一格的值,我这里选择的是correlation_matrix,意思是代表的是相关系数的值。
2024-11-03 18:54:44
735
1
原创 如何批量对子文件夹中的文件更名|基于MATLAB的数据整理
最近学习CAT12分析发现,VBM的分析需要提前将所有个体的nii文件放在一起,但是前期DICOM转格式之后,每个个体的nii分别是在一个以个体ID为名字的独立文件夹中,如何根据每个个体的ID对每个个体的nii进行更名。DICOM原始核磁采集时的命名往往混乱无序而且冗长,通过ID号对个体文件的命名进行重新整理。我利用MATLAB写了一段代码,进行更名+移动文件的操作。
2024-11-03 18:06:13
659
原创 基于6-12岁中国儿童的脑图谱模版
最近阅读文献发现了一个基于中国儿童的脑图谱模版,由贺永课题组及其合作者提出,采用328例6至12岁中国儿童的T1和T2加权磁共振图像构建,绘制出的“中国儿童标准脑结构发育图谱” Chinese Pediatric Atlas (CHN-PD Atlas)脑图谱下载地址:https://www.nitrc.org/projects/chn-pd。
2024-11-03 17:28:26
500
原创 如何利用SPM12改变脑模版的分辨率|重采样
在CAT12做VBM的时候,发现我自己想定义的脑区分割图谱mask与用于分割的组织概率图TPM模版分辨率不一致,TPM的分辨率为1.5mm,而我使用的mask是1mm。因此尝试使用SPM12的Coregister模块对mask的分辨率进行转换,使之改成与TPM一致的1.5mm分辨率源文件:SPM12自带的TPM文件(如/spm12/tpm/TPM.nii)目标文件:我使用的mask文件(比如BN_Atlas_246_1mm.nii)
2024-11-03 17:12:36
1188
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅