tommyhechina
码龄7年
求更新 关注
提问 私信
  • 博客:165,061
    165,061
    总访问量
  • 18
    原创
  • 328
    粉丝
  • 6
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:英国
加入CSDN时间: 2018-04-20

个人简介:复旦大学生命科学院遗传学专业研究生。

博客简介:

Cirno's Bioinformatic Career

博客描述:
The Journey from ⑨ to Expert
查看详细资料
个人成就
  • 获得104次点赞
  • 内容获得22次评论
  • 获得574次收藏
  • 代码片获得392次分享
创作历程
  • 18篇
    2018年
成就勋章
TA的专栏
  • 杂谈感想
    1篇
  • 芯片数据分析
    8篇
  • 数学
  • R包常用函数
    9篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

创作活动更多

新星杯·14天创作挑战营·第9期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛! 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见 https://bbs.csdn.net/topics/619626357 2、文章质量分查询:https://www.csdn.net/qc

475人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

芯片数据分析步骤7 合并重复探针

合并重复探针合并探针的原因为了避免非特异性结合等干扰因素影响实验结果,芯片厂商往往采取多个探针检测同一基因表达的策略,从而导致注释探针后发现许多探针被注释为同一个基因。但在后续的分析中,程序往往不能接受表达矩阵中存在多个探针对应同一基因。因此,在进行后续分析之前,我们需要选取一个标准,对被注释为同一基因的探针进行合并。唯一要注意的是,要在过滤后再合并重复探针。合并重复探针的方法...
原创
发布博客 2018.05.27 ·
11138 阅读 ·
6 点赞 ·
2 评论 ·
44 收藏

芯片数据分析步骤6 探针注释

注释探针注释探针的原因为了防止非特异性结合造成的干扰,芯片厂商往往会使用多个探针检测同一个基因的表达。因此,芯片厂商不会使用基因名作为探针的名称,而是使用自己定义的探针名称。要合并重复探针,我们必须先对探针进行注释,确定每个探针对应检测哪个基因的表达,然后再合并重复探针。而后续分析如GSEA,只能对基因进行分析,因此也要求对探针进行注释。注释探针的方法1 使用芯片厂商的...
原创
发布博客 2018.05.22 ·
31683 阅读 ·
25 点赞 ·
5 评论 ·
143 收藏

芯片数据分析步骤5 过滤探针

过滤探针过滤探针的原因表达谱芯片上的探针往往能够覆盖到所有人类基因,也就是说,能够同时检测所有人类基因的表达。但先前的实验表明,一个细胞中不可能所有基因都同时表达,能够同时表达的基因反而是少数。同时表达的基因约占总基因的40%左右。由于探针与目标之间一定存在着非特异性结合,所以所有的探针均会产生信号。如果不加以过滤,认为这些探针对应的基因都表达,即不符合事实,也会对后续的分析产生影...
原创
发布博客 2018.05.22 ·
8746 阅读 ·
3 点赞 ·
3 评论 ·
45 收藏

芯片数据分析步骤4 标准化-affy

标准化标准化的原因芯片实验中存在大量干扰因素,标准化可以削弱这些干扰因素,使得实验条件下的测量可以相互比较。常见干扰因素:芯片杂交的RNA总量不一致、芯片表面不平整、探针非特异性结合、杂交条件不一致。注意,limma包的说明里面提供了两点建议。一,如果要进行探针过滤(filter),最好在进行标准化之后再过滤。二,如果要在后续分析中使用limma包,请不要进行基于方差(vari...
原创
发布博客 2018.05.17 ·
23011 阅读 ·
11 点赞 ·
0 评论 ·
93 收藏

芯片数据分析步骤3 芯片质量控制-affy

affy芯片质量控制前言大家手头的芯片数据一般有两个来源,一个是自己做的芯片的数据,一个是从数据库下载的芯片数据。如果是自己做的芯片的数据,是一定要进行芯片质量控制的。虽然厂家会提供芯片质量分析的结果,但如果有可能的话,最好还是自己也进行质量分析。根据分析的结果,决定排除哪些芯片的数据,甚至重做也是有可能的。一定只能用质量好的芯片数据,否则可能影响实验结果。自己做的芯片数据在质量控...
原创
发布博客 2018.05.16 ·
11962 阅读 ·
4 点赞 ·
5 评论 ·
45 收藏

芯片数据分析步骤2 读取数据-affy

读取affy表达谱芯片数据的方法Affymetrix表达谱芯片数据读取的方法分3种:1、使用affy包读取。(HGU95/HGU133芯片)2、使用oligo包读取。(Whole Transcriptome 芯片/ NimbleGen 芯片/ SNP芯片等)3、使用simpleaffy包读取。(HGU95/HGU133芯片)说明1 使用 affy 包读取1 ju...
原创
发布博客 2018.05.12 ·
14119 阅读 ·
5 点赞 ·
0 评论 ·
51 收藏

芯片分析步骤1 芯片数据下载-ArrayExpress

从ArrayExpress数据库下载数据的方法1、在ArrayExpress Search中输入编号或是关键词,选择符合的Accession,在ftp中进行手动下载,或是在R中用ArrayExpress包下载。2、使用R包ArrayExpress的queryAE命令下载搜索结果,挑选合适的Accession,在R中使用ArrayExpress包进行下载。ArrayExpress数据库的...
原创
发布博客 2018.05.12 ·
11349 阅读 ·
6 点赞 ·
0 评论 ·
33 收藏

simplyaffy包常用函数

simplyaffy常用函数1 call.exprs功能:使用MAS5,GCRMA或RMA算法生成表达矩阵。返回值:ExpressionSet。call.exprs(x, algorithm = "rma", do.log = TRUE, sc = 100, method = NA) 参数 注释 x AffyBatch对象。 al...
原创
发布博客 2018.05.12 ·
1244 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

oligo包常用函数

oligo常用函数1 darkColors功能:提供颜色。返回值:表示颜色的字符。darkColors(n)seqColors(n)seqColors2(n)divColors(n)注意:darkColors是基于RColorBrewer包设计的。2 fitProbeLevelModel功能:对FeatureSet拟合robust Probe L...
原创
发布博客 2018.05.12 ·
2801 阅读 ·
3 点赞 ·
0 评论 ·
9 收藏

gcrma包常用函数

gcrma常用函数1 compute.affinities功能:计算探针亲和数据。返回值:返回一个包含有PM和MM探针亲和数据的AffyBatch。compute.affinities(cdfname,verbose=TRUE)compute.affinities2(cdfname,verbose=TRUE) 参数 注释 cdfname ...
原创
发布博客 2018.05.12 ·
1687 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

genefilter包常用函数

genefilter常用函数1 findLargest功能:只留下检验统计量最大的探针,舍弃其他重复探针。返回值:包含探针名称的list。findLargest(gN, testStat, data = "hgu133plus2") 参数 注释 gN 包含所有探针名称的list。 testStat 包含检验检测统计量的list...
原创
发布博客 2018.05.12 ·
3086 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

GEOquery包常用函数

GEOquery常用函数1 getGEO功能:从GEO数据库下载数据。返回值:GDS/GSE/GSM/GPL。取决于GEO参数。getGEO(GEO = NULL, filename = NULL, destdir = tempdir(), GSElimits = NULL, GSEMatrix = TRUE, AnnotGPL = FALSE, getGPL = T...
原创
发布博客 2018.05.12 ·
9317 阅读 ·
13 点赞 ·
0 评论 ·
65 收藏

arrayQualityMetrics包常用函数

arrayQualityMetrics常用函数1 aqm.writereport功能:使用aqmReportModule生成质量报告。返回值:质量报告。aqm.writereport(modules, arrayTable, reporttitle, outdir) 参数 注释 modules 含有 aqmReportModule 对象的...
原创
发布博客 2018.05.12 ·
1177 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

ArrayExpress包常用函数

ArrayExpress常用函数1 ae2bioc功能:将MAGE-TAB文件从raw data转换为bioconductor对象。返回值: AffyBatch, ExpressionSet 或 NChannelSet。assayData储存表达值,phenoData储存sdrf,featureData储存arf,experimentData储存idf。ae2bioc(...
原创
发布博客 2018.05.12 ·
3926 阅读 ·
4 点赞 ·
0 评论 ·
14 收藏

affyPLM包常用函数

GEOquery常用函数1 fitPLM功能:通过拟合探针水平模型(probe-level model),将AffyBatch转换为PLMset。返回值:PMLset。fitPLM(object,model=PM ~ -1 + probes +samples,variable.type=c(default="factor"),constraint.type=c(de...
原创
发布博客 2018.05.12 ·
3425 阅读 ·
2 点赞 ·
1 评论 ·
10 收藏

芯片数据分析步骤1 芯片数据下载-GEO

从GEO数据库下载数据的方法1、在GEO DATASETS中输入关键词,选择符合的GSE,在ftp中进行手动下载2、找到符合的GSE,在R中使用GEOquery包进行下载GEO数据库的数据种类1、Platforms 平台包含有芯片的探针信息,如cDNAs,寡核苷酸,ORFs,抗体。以GPLxxx编号。一个platform可以包含不同人上传的不同sample。不同...
原创
发布博客 2018.05.06 ·
15270 阅读 ·
5 点赞 ·
0 评论 ·
59 收藏

affy包常用函数

affy常用函数1 AffyRNAdeg功能:计算RNA降解相关的统计数据并用图形展示。返回值:RNA降解相关的统计数据及图形展示。 项目 描述 sample.names 样品名称 means.by.number average intensity by probe position ses standard error...
原创
发布博客 2018.05.06 ·
4936 阅读 ·
2 点赞 ·
0 评论 ·
25 收藏

人生第一篇生物信息学博客

这虽然不是人生的第一篇博客,但却是踏入生物信息学领域后的第一篇博客。 先说说我自己吧。93年生人,在基督教信徒眼中最神圣的节日出生。但无论是心性,才华亦或是雄心壮志,都无法与那位相提并论,甚至连衣角都不可触及。 从小由于亲人因为肿瘤去世,便立志投身于肿瘤领域,为攻克癌症尽一份力。从初中开始便参加生物竞赛,高中更是成为省队中的一员。由于我那年竞赛体制还没有改革,所以有幸逃过高考一劫,进入了复旦大...
原创
发布博客 2018.04.20 ·
5478 阅读 ·
15 点赞 ·
3 评论 ·
27 收藏
加载更多