生物信息学
文章平均质量分 63
楷然教你学生信
日常发布生信和R语言相关知识,适合临床医学,基础医学,生物信息学。
展开
-
数据太大的时候,R语言如何读取?
一般我喜欢把文件储存成csv格式,然后用read.csv读取文件。也有的人习惯储存数据为txt格式,然后用read.table读取文件。但是当数据太大的时候,read.csv和read.table似乎就不适用了。首先读取慢,而且读到最后会读一个寂寞。比如下面这个文件:有三个多G,用read.csv读取的时候,会发生什么状况呢?setwd("D:\\")dir()data <- read.table("GSE149614_HCC.scRNAseq.S7191...原创 2022-04-16 17:26:57 · 11036 阅读 · 8 评论 -
绘制一张好看的散点图及pearson和spearman相关性分析的选择
绘制一张好看的散点图及pearson和spearman相关性分析的选择原创 2022-04-09 13:23:51 · 9982 阅读 · 1 评论 -
分享另一个蛋白质数据库——GeneMANIA database
上次分享了几个蛋白质数据库:最近看文章有人用这个数据库,所以特地去操作了一下,下面是引用此数据库对应的文章:下面我们进网站看一看:GeneMANIA这是网址该网站主界面如上所示,他还推荐了一个cytoscape app下面我们要做的就是将基因输入到上面去:然后选择物种:点击放大镜按钮,等个几秒钟:然后就出现网络图了。点击左边不同的按钮可以看到不同排布方式的网络图:右边显示的就是蛋白连接对应的...原创 2022-04-06 08:00:00 · 8159 阅读 · 2 评论 -
分享几个蛋白质互作网站——String (二)多基因蛋白互作
今天讲多基因蛋白互作。然后分享几个别的蛋白互作网站。原创 2022-04-04 22:55:58 · 8970 阅读 · 0 评论 -
分享一个蛋白互作网站——String (一)
筛选的差异基因或者想要研究的基因和哪些蛋白有相互作用呢?可以用到很多网站来进行预测,下面我们先讲最火的一个——String database.原创 2022-04-03 17:14:02 · 7019 阅读 · 0 评论 -
分享一个自噬相关的数据库
分享一个自噬相关的数据库原创 2022-04-02 00:00:00 · 2639 阅读 · 1 评论 -
分享分析TCGA的数据库——GEPIA(二)
GEPIA介绍(二)原创 2022-04-01 01:00:00 · 6218 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(四)——Fisher检验
费希尔精确概率检验(Fisher's precision probability test),亦称“四格表的确切概率法”。主要用于四格表资料各格中有一格理论次数小于 5 时的独立性检验的方法。原创 2022-03-30 04:00:00 · 6576 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(三)——卡方检验
卡方检验是用途很广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。卡方检验的适用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。在生物信息学中,什么时候用到卡方检验?例如:我们研究某个基因与患者临床的关系。基于基因的中位表达值将样本分成高低表达...原创 2022-03-29 02:00:00 · 1970 阅读 · 0 评论 -
分享一个CCLE细胞系数据(CCLE数据库不能用了吗?)
癌细胞系百科全书项目 - Broad 研究所与诺华生物医学研究所之间的合作2006 年,Sellers (Novartis)、Garraway (Broad Institute) 和 Schlegel (Novartis) 为约 1000 个癌细胞系的大规模基因表征制定了初步项目计划。该项目随后两次更新,因此我们将这些视为 CCLE 项目的三个阶段。其网址如下:Cancer Cell Line Encyclopedia (CCLE)来看看界面,CCLE数据库似乎改版了:点击dataset原创 2022-03-24 00:52:41 · 16914 阅读 · 7 评论 -
分享一个TCGA数据库
TCGA(The Cancer Genome Atlas, 癌症基因组图谱)是美国国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。原创 2022-03-23 02:45:00 · 4826 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(二)——单因素方差分析
上次说到t检验,是检验两组数据的均数差异,链接如下:(生物信息学)R语言与统计学入门(一)——t 检验_李京弦的博客-CSDN博客这次我们来介绍一下单因素方差分析。单因素方差分析:方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。简单地说,t检验比较的是两组均数,方差分析比较的就是三组。在生物信息学中常用于情况呢:比如临床分期,如下图:假设我们找到一个基...原创 2022-03-22 00:37:26 · 1574 阅读 · 0 评论 -
分享一个铁死亡数据库
铁死亡(Ferroptosis )是一种铁依赖性的,区别于细胞凋亡、细胞坏死、细胞自噬的新型的细胞程序性死亡方式。该数据库的链接是:http://www.zhounan.org/ferrdb我们来看一看这个数据库:这是数据库主界面,可以看到此数据库是在不断更新中。数据库分类:driver:诱导铁死亡的基因suppressor:抑制铁死亡的基因marker:发生铁死亡时的标志物inducer:诱导铁死亡的化合物inhibitor:抑制铁死亡的化合物disease:铁原创 2022-03-21 01:02:33 · 2942 阅读 · 2 评论 -
选择最适cut-off值的原因及X-tile的使用
为什么要选择最适的cut-off值。原创 2022-03-19 08:00:00 · 14103 阅读 · 18 评论 -
R语言中主要的颜色对照图
R语言作图,颜色的选择是比较头疼的事情,以下向大家分享R语言中主要的几百种颜色。原创 2022-03-03 08:59:34 · 7984 阅读 · 0 评论 -
分享一个外泌体数据库
外泌体在肿瘤的发生、发展和转移中起着至关重要的作用。外泌体可以诱导或促进肿瘤形成。原创 2022-03-16 22:58:25 · 904 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(一)——t 检验
t检验,亦称student t检验(Student's t test),比较两个平均数的差异是否显著。原创 2022-03-17 17:01:28 · 2632 阅读 · 1 评论 -
分享一个药物预测网站DesigN
DesigN网站的参考文献来自一下链接:DeSigN: connecting gene expression with therapeutics for drug repurposing and development - PubMed该网站链接如下:DeSigN - Cancer Research MalaysiaDeSigN 是一种稳健的方法,可用于使用从基因表达分析中获得的输入基因特征来识别候选药物。这个用户友好的平台可用于识别对感兴趣的癌细胞系具有意想不到的功效的药物,因此可用于药物的再利用原创 2022-03-04 12:43:19 · 1085 阅读 · 1 评论