一篇文章讲懂艾伦脑图谱在做什么(原理,数据处理)

全文笔记以及标准预处理代码可关注微信公众号【大脑探路者】回复【艾伦脑图谱】获取


基因的表达水平通常通过测量特定基因转录出的mRNA的数量或由其编码的蛋白质的数量来评估。这是基因活性的一个重要指标,对于理解生物体的生理和病理过程至关重要。
Allen Human Brain Atlas (AHBA) 是一个整合了大脑基因表达的多模态人脑图集,为研究者提供了免费的可视化和数据挖掘资源,使研究人员能够发现结构,功能和分子生物学之间的联系。

Allen基因表达数据的获取

首先了解一下Allen基因表达数据怎么获取的:
微阵列技术是基因表达水平的检测方法之一,如下的图表示一个DNA微列阵。
DNA微阵列(DNA microarray),也叫基因芯片,是近几年发展起来的一种能快速、高效检测DNA片段序列、基因型及其多态性或基因表达水平的新技术。它将几十个到上百万个不等的称之为探针的核苷酸序列固定在微小的(约1cm2)玻璃或硅片等固体基片或膜上,该固定有探阵的基片就称之为DNA微阵列。它利用核苷酸分子在形成双链时遵循碱基互补原则,可以检测出样本中与探阵阵列中互补的核苷酸片段,从而得到样本中关于基因结构和表达的信息。
简而言之,DNA微阵列是一块带有数千或数万个DNA探针的特殊玻璃片。这些探针通常与基因组中的特定基因序列互补,用于捕获和检测相应的cDNA分子。

在这里插入图片描述

Allen基因表达数据的获取:从大脑切片的脑组织中提取出RNA,通过逆转录RNA(特别是mRNA)得到的DNA分子(cDNA), 做荧光标记,使用DNA微阵列测量每个基因表达的水平。

cDNA(互补脱氧核糖核酸)是通过逆转录RNA(特别是mRNA)得到的DNA分子。逆转录是一个在逆转录酶的作用下,以RNA为模板合成DNA的过程。
由于cDNA是由特定基因的mRNA逆转录得到的,因此它只包含该基因的外显子序列。当cDNA与DNA微阵列上的互补序列杂交时,可以通过检测杂交信号来评估该基因的表达水平。RNA是基因表达的直接产物,而cDNA则是通过逆转录RNA得到的,用于进一步的分析和研究。

在基因表达分析(如使用DNA微阵列技术)中,通常需要从细胞或组织中提取RNA,然后将其逆转录成cDNA,再进行荧光标记和杂交分析。这样,就可以通过检测杂交信号来评估不同基因的表达水平

AHBA的原始数据

每个捐献者有5个excel表,第一个excel表Probes.csv,行表示探针,列包括探针名字probe_name,对应基因名字gene_name,基因标准id号entraz_id,染色体位置chrooson。
在这里插入图片描述

第二个excel表Microarray expression为样本注释信息,标准化的表达值,行列分别表示探针和样本(在多少大脑的部位采样就有多少样本)。第一列是Porbe ID。
在这里插入图片描述
第三个excel表Sample Annot.csv ,表示采样点的具体信息,行表示结构id编号(大脑的部位),列表示取自大脑的部位的原始体素位置和标准体素位置。
在这里插入图片描述

第四个excel表Ontology.csv表示采样的脑结构信息,
在这里插入图片描述
第五个excel表PACall.csv显示每个探针在每个样本上的基因表达是否超过背景噪声,,用于质控。
在这里插入图片描述

AHBA的七大标准预处理步骤

在这里插入图片描述
预处理步骤:①基因探针的重注释,因为基因库在不断更新,需要对探针基因信息更新。②数据过滤,因为杂交是非特异性的,需要过滤噪声信息。③探针选择,基因表达对应多个探针。④重新分配样本,6个样本上取得样本,针对自己的数据集重新分配。⑤数据标准化,⑥基因过滤,⑦得到每个脑区基因表达
在这里插入图片描述
代码可在公众号【大脑探路者】回复【艾伦脑图谱】获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值