![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
芯片数据分析
文章平均质量分 85
tommyhechina
复旦大学生命科学院遗传学专业研究生。
展开
-
芯片数据分析步骤4 标准化-affy
标准化标准化的原因芯片实验中存在大量干扰因素,标准化可以削弱这些干扰因素,使得实验条件下的测量可以相互比较。常见干扰因素:芯片杂交的RNA总量不一致、芯片表面不平整、探针非特异性结合、杂交条件不一致。注意,limma包的说明里面提供了两点建议。一,如果要进行探针过滤(filter),最好在进行标准化之后再过滤。二,如果要在后续分析中使用limma包,请不要进行基于方差(vari...原创 2018-05-17 20:05:37 · 22537 阅读 · 0 评论 -
芯片分析步骤1 芯片数据下载-ArrayExpress
从ArrayExpress数据库下载数据的方法1、在ArrayExpress Search中输入编号或是关键词,选择符合的Accession,在ftp中进行手动下载,或是在R中用ArrayExpress包下载。2、使用R包ArrayExpress的queryAE命令下载搜索结果,挑选合适的Accession,在R中使用ArrayExpress包进行下载。ArrayExpress数据库的...原创 2018-05-12 15:49:02 · 10922 阅读 · 0 评论 -
芯片数据分析步骤2 读取数据-affy
读取affy表达谱芯片数据的方法Affymetrix表达谱芯片数据读取的方法分3种:1、使用affy包读取。(HGU95/HGU133芯片)2、使用oligo包读取。(Whole Transcriptome 芯片/ NimbleGen 芯片/ SNP芯片等)3、使用simpleaffy包读取。(HGU95/HGU133芯片)说明1 使用 affy 包读取1 ju...原创 2018-05-12 15:51:33 · 13717 阅读 · 0 评论 -
芯片数据分析步骤1 芯片数据下载-GEO
从GEO数据库下载数据的方法1、在GEO DATASETS中输入关键词,选择符合的GSE,在ftp中进行手动下载2、找到符合的GSE,在R中使用GEOquery包进行下载GEO数据库的数据种类1、Platforms 平台包含有芯片的探针信息,如cDNAs,寡核苷酸,ORFs,抗体。以GPLxxx编号。一个platform可以包含不同人上传的不同sample。不同...原创 2018-05-06 13:17:53 · 14997 阅读 · 0 评论 -
芯片数据分析步骤3 芯片质量控制-affy
affy芯片质量控制前言大家手头的芯片数据一般有两个来源,一个是自己做的芯片的数据,一个是从数据库下载的芯片数据。如果是自己做的芯片的数据,是一定要进行芯片质量控制的。虽然厂家会提供芯片质量分析的结果,但如果有可能的话,最好还是自己也进行质量分析。根据分析的结果,决定排除哪些芯片的数据,甚至重做也是有可能的。一定只能用质量好的芯片数据,否则可能影响实验结果。自己做的芯片数据在质量控...原创 2018-05-16 13:47:58 · 11597 阅读 · 5 评论 -
芯片数据分析步骤7 合并重复探针
合并重复探针合并探针的原因为了避免非特异性结合等干扰因素影响实验结果,芯片厂商往往采取多个探针检测同一基因表达的策略,从而导致注释探针后发现许多探针被注释为同一个基因。但在后续的分析中,程序往往不能接受表达矩阵中存在多个探针对应同一基因。因此,在进行后续分析之前,我们需要选取一个标准,对被注释为同一基因的探针进行合并。唯一要注意的是,要在过滤后再合并重复探针。合并重复探针的方法...原创 2018-05-27 12:16:28 · 10968 阅读 · 3 评论 -
芯片数据分析步骤5 过滤探针
过滤探针过滤探针的原因表达谱芯片上的探针往往能够覆盖到所有人类基因,也就是说,能够同时检测所有人类基因的表达。但先前的实验表明,一个细胞中不可能所有基因都同时表达,能够同时表达的基因反而是少数。同时表达的基因约占总基因的40%左右。由于探针与目标之间一定存在着非特异性结合,所以所有的探针均会产生信号。如果不加以过滤,认为这些探针对应的基因都表达,即不符合事实,也会对后续的分析产生影...原创 2018-05-22 18:42:11 · 8387 阅读 · 3 评论 -
芯片数据分析步骤6 探针注释
注释探针注释探针的原因为了防止非特异性结合造成的干扰,芯片厂商往往会使用多个探针检测同一个基因的表达。因此,芯片厂商不会使用基因名作为探针的名称,而是使用自己定义的探针名称。要合并重复探针,我们必须先对探针进行注释,确定每个探针对应检测哪个基因的表达,然后再合并重复探针。而后续分析如GSEA,只能对基因进行分析,因此也要求对探针进行注释。注释探针的方法1 使用芯片厂商的...原创 2018-05-22 18:46:36 · 31148 阅读 · 5 评论