自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(936)
  • 收藏
  • 关注

原创 校准曲线的绘制的小技巧

欢迎关注”生信修炼手册”!在之前关于列线图的文章中,我们介绍了利用列线图来可视化预后模型,同时也提到了模型性能的几种评估方式,校准度以及校准曲线就是其中一种方式。校准度,用来描述一个模型预测个体发生临床结局的概率的准确性。在实际应用中,通常用校准曲线来表征。校准曲线展示了模型预测值与实际值之间的偏差,一个典型的校准曲线示例如下横轴表示模型预测的不同临床结局概率,纵轴表示实...

2022-06-15 20:30:34 348

转载 《零基础免费学扩增子分析》视频课(含ppt及相应代码),无需转发,直接获取...

扩增子测序是一种二代靶向测序技术,它使用PCR技术来生成称为扩增子的DNA序列。它简单、快速、应用广泛。扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息。扩增子测序包括16S rDNA, 18S rDNA以及ITS的测序。16S rDNA是细菌分类学研究中最常用分类的marker基因信息,其序列包含9个可变区(Variable region)和10个保守区...

2022-06-13 20:28:46 98

原创 如何绘制一幅优雅的列线图

欢迎关注”生信修炼手册”!列线图在预后建模的相关文章中随处可见,除了传统的只有坐标轴的列线图,还包括下列这种展示信息更加丰富的列线图在经典的列线图的坐标轴元素的基础上,对于连续型变量,采用了直方图的形式来展示其分布,另外还可以在图上标记比较某个患者各个指标的points 以及基于模型预测的生存概率。像这样一张信息丰富的列线图如何来实现呢? ...

2022-06-10 20:34:56 275 2

原创 手把手教你绘制最基础的列线图

欢迎关注”生信修炼手册”!在之前的文章中,我们介绍了列线图的含义和构建方法,本文重点介绍下绘制列线图的代码,经典的列线图如下所示当我们构建好一个预后模型之后,可以通过列线图来可视化其公式,最常用的绘图方法是通过rms这个R包,以pbc这个生存分析的数据为例,展示下其基本用法> library(rms)> pbc <- pbc[pbc$status %i...

2022-06-08 20:24:39 1764

转载 半年新增56家公司招CADD/AIDD,搞生信,大家是认真的

创新药内卷严重,九死一生,而且烧钱速度惊人。不管Big Pharma还是Biotech都压力山大,销售额、利润要涨,研发费用要边涨边控。Biotech求活下去,求快速具备造血能力;Big Pharma求踩稳创新药这一条新成长曲线,探索国际化的发展模式。如何做到:速度要快,姿势还要帅?第一:堆新药研发人才自己培养和直接抢人,这两条路一般同时进行。培养一个新药研发人才和培养一...

2022-06-06 20:32:43 216

原创 文献阅读|Nomograms列线图在肿瘤中的应用

欢迎关注”生信修炼手册”!列线图,也叫诺莫图,在肿瘤研究的文章中随处可见,只要是涉及预后建模的文章,展示模型效果除了ROC曲线,也就是列线图了。那么列线图究竟是什么,列线图怎么得到,从图中我们可以得到哪些信息,带着这些问题,我们来阅读下面的这篇文献,地址如下>https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4465353/1...

2022-06-01 20:27:06 473

原创 绘制cox生存分析结果的森林图

欢迎关注”生信修炼手册”!在之前meta分析的文章中我们介绍了森林图的画法,典型的森林图如下所示每一行表示一个study,用errorbar展示log odds ratio值的分布,并将p值和m值标记在图中。森林图主要用于多个study的分析结果的汇总展示。在构建预后模型时,通常会先对所有基因进行单变量cox回归,然后筛选其中显著的基因进行多变量cox回归来建模,对于co...

2022-05-30 20:32:22 1219

原创 组间差异分析就要这样可视化!

欢迎关注”生信修炼手册”!在之前的文章中,我们分享了多个基因差异分析的可视化,使用的是ggpubr这个R包,ggpubr在标记p值时,可以根据指定的差异分组自动添加组间的连线,非常方便,但是无法指定添加的p值的位置,在某些时候会缺乏灵活性,今天要介绍的是另外一个R包ggsignif,其帮助手册链接如下https://cran.r-project.org/web/packa...

2022-05-25 20:26:15 233

原创 冲击图和桑基图,傻傻分不清楚!

欢迎关注”生信修炼手册”!在之前的文章中,我们介绍了桑基图的可视化原理,而冲击图作为桑基图的一个子类,其展示的信息和桑基图基本一致,只不过在输入数据的格式上要略作调整。绘制冲击图,推荐使用ggalluvial这个R包,从名字也可以看出,这个一个建立在ggplot2语法基础上的扩展包,官方链接如下http://corybrunson.github.io/ggalluvial...

2022-05-23 20:22:26 140

原创 两组数据的相关性如何可视化,这个思路值得借鉴!

欢迎关注”生信修炼手册”!相关性分析是最常用的分析策略之一,对于两组数据相关性结果的可视化,可以借鉴文献中的表现形式,图示如下采用了组合图表的形式,主体是两组数据构成的散点图,在散点图中显示线性拟合的直线,并标记相关系数和相关性检验的p值;同时在上方和右侧方,用直方图的形式展示看每组数据的各自分布。这样的一幅图表,把相关性分析的多种信息同时展现了出来,信息量丰富而且美观。...

2022-05-20 20:25:01 1352

原创 多组差异分析的可视化,这样做最省心!

欢迎关注”生信修炼手册”!下图是来自文献中的一个示例图,展示了不同亚型之间risk score值的差异分析结果从图形的主题可以看出,这是一幅基于ggplot2绘制的图片,但是如果完全基于ggplot2的基础函数的话,我们需要手动绘制组间比较的连线,计算对应的坐标并添加p值,虽然也可以实现,但不免太过繁琐。想要更加便利的展示组间差异的结果,可以使用ggpubr这个R包。这是...

2022-05-18 20:29:54 770

原创 快速掌握生存分析的可视化

欢迎关注”生信修炼手册”!生存分析在预后建模中的作用不必多言,在之前介绍的NAD+基因的文献中,出现了3种生存分析的可视化方式,文献链接如下https://www.frontiersin.org/articles/10.3389/fcell.2022.831273/full对于生存分析的可视化,最常用的就是R包survminer,核心函数就是ggsurvplot,链接如...

2022-05-16 20:21:36 59

原创 一键获取graphpad同款主题

欢迎关注”生信修炼手册”!graphpad是一款商业化的绘图软件,支持多种可视化形式,而且样式美观,下图就是其典型的输出graphpad的强大之处在于默认样式的美观,以及所有组件的可编辑,通过鼠标操作可以像ps一样添加和修改任何图片中的元素。ggplot2则是基于R语言的开源免费工具,其特点在于自动化,所有的操作都通过代码来实现,为了进一步扩增ggplot2的功能,开发者...

2022-05-13 20:23:00 194

原创 表达量差异分析结果的可视化

欢迎关注”生信修炼手册”!对于任意的表达量数据,定量加差异分析都是一套经典的组合拳。当我们想要展示特定基因的组间差异结果时,下面这种图表就派上了用场横坐标为基因,纵坐标是基因表达量,每一组的表达量采用了箱体图的形式来展现,当然也可以换成小提琴图等其他描述总体分布的可视化方式。对于每一个基因,通过并列的两组箱体来定性的展示两组间的分布差异,而图中星号则表示差异分析的p值,定...

2022-05-11 20:27:00 404

原创 好看的桑基图是如何炼成的!

欢迎关注”生信修炼手册”!Sankey Diagram,也叫做桑基图,是一种展示数据流的可视化方式,一张典型的桑基图示例如下这张图展示的是不同国家之间的人口流动,可以看到图中包含了如下几个因素1. node,即节点,常用矩形方块和文字注释来表示,在上图中表示的是不同的国家2. link,即连线,表示不同节点之间的数据流通,这个连线是有方向的,从节点A流向节点B,节...

2022-05-09 20:29:00 751

原创 预后建模绕不开的lasso cox回归

欢迎关注”生信修炼手册”!回归我们并不陌生,线性回归和最小二乘法,逻辑回归和最大似然法,这些都是我们耳熟能详的事物,在生物信息学中的应用也比较广泛, 回归中经常出现两类问题,欠拟合和过拟合。对于欠拟合,简单而言就是我们考虑的少了,一般通过在回归模型中增加自变量或者扩大样本数量来解决;对于过拟合,简单而言就是考虑的太多了,模型过于复杂了,这时候可以对已有的自变量进行筛选,在...

2022-05-07 20:27:00 2636

原创 学会富集分析,必须掌握的clusterProfiler生态!

欢迎关注”生信修炼手册”!clusterProfiler是富集分析最强大的R包,内置支持多种物种,并且支持自定义数据库来进行富集。为了进一步强化clusterProfiler的功能,其开发者开发了一系列富集分析的R包,可谓是富集分析的生态圈,掌握这些包的用法,拿下富集分析不在话下。本文重点介绍如何使用这个包来完成富集分析并进行可视化,我们的目标图像展示如下 ...

2022-04-29 20:26:00 1837

原创 ConsensusClusterPlus, 一步到位的一致性聚类!

欢迎关注”生信修炼手册”!在之前的文章中分享了一致性聚类的原理,本文介绍下如何用R语言进行分析。ConsensusClusterPlus这个R包,就是专门用于一致性聚类分析的,为了简化调用,甚至将所有的步骤都封装到了一个函数里面,所以其使用方法非常的简单,一共三步1. 加载R包2. 把表达量数据读进去3. 运行一致性聚类的函数是不是和把大象装进冰箱一样简单,但是我们必须注...

2022-04-27 20:28:00 4488 2

原创 一致性聚类的最佳K值如何选,你真的搞清楚了吗?

欢迎关注”生信修炼手册”!聚类,是机器学习领域的一大研究方向,属于无监督学习,其算法也是层出不穷,多种多样,在本公众号之前的文章中也详细介绍了各种聚类算法,感兴趣的读者可以搜索之前的文章进行查看。将聚类算法应用于基因表达谱数据,来挖掘其中有价值的生物学信息,是非常典型的一类机器学习算法在生物学领域的应用。本文要介绍的一致性聚类,就是这样的一种聚类算法, 这种方法在癌症基因...

2022-04-25 20:25:00 884

原创 巧用热图展示基因分布的总体趋势

欢迎关注”生信修炼手册”!热图是最常见的基因表达量数据的可视化方式,将每个单元格的表达量按照数值高低映射为不同的颜色,可以直观展示表达量在不同样本间的分布,再综合聚类的结果和基因/样本的注释信息,进一步丰富了展示的信息,一个经典的热图如下图中提供了两大类的信息,第一大部分也是热图的主体部分,即表达量信息,上图中,每一列表示样本,每一行表示基因,用不同颜色表征表达量的不同数...

2022-04-24 20:35:00 500

原创 使用sva包处理批次效应

欢迎关注”生信修炼手册”!SVA适用于高维数据的批次效应校正,支持以下数据1. 基因芯片2. RNA-seq3. 甲基化表达谱4. 其他表达量数据提供了两种方法来处理不同的批次效应1. 直接校正已知的batch effect,使用ComBat函数2. 识别未知的batch effect,并校正,使用sva函数需要注意的是,在校正批次效应之前,表达量数据必须经过归一化操...

2022-04-22 20:22:00 1172 1

原创 整理NAD+代谢相关基因

欢迎关注”生信修炼手册”!在ALS患者NAD+基因预后模型的文献中,提供了NAD+代谢相关基因的集合来自KEGG和Reactome两个数据库,本文主要介绍下从这两个数据库获取基因列表的方法1. KEGG在该数据库中,代谢通路hsa00760表示烟酸和烟酰胺代谢通路,链接如下https://www.genome.jp/dbget-bin/www_bget?pathway+h...

2022-04-18 20:22:00 2854

转载 手把手教你处理illumina beadchip芯片数据

欢迎关注”生信修炼手册”!在NAD+代谢相关的文献中,使用了两批illumina beadchip的芯片数据进行分析,本文以其中一篇数据为例,详细展示该平台的数据处理流程。GSE112676包含741个样本的全血基因表达谱数据,链接如下https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE112676该数据的处理流程在...

2022-04-15 20:24:00 701

原创 cel格式的表达谱芯片数据如何读取?

欢迎关注”生信修炼手册”!后缀为cel的芯片文件,对应的芯片平台为Affymetrix,针对这一平台的数据,可以通过R包affy来读取,读取时我们需要以下两种文件1. 后缀为cel的探针荧光信号强度文件2. 后缀为cdf的探针布局文件cel文件是芯片扫描之后的原始数据文件,而cdf文件是每个芯片平台对应的文件,cdf格式的详细解释可以参考如下链接https://medi...

2022-04-13 20:34:00 1271

原创 教你分析后缀为gpr的芯片数据

欢迎关注”生信修炼手册”!分析芯片数据,我们首先需要确定芯片平台。不同的芯片平台技术不同,既有单通道,也有双通道,而且输出文件的格式也不同。目前常见的平台有以下几种1.genepix2. illumina beadchip3. Agilent4. Affymetrix对于前三种平台而言,我们都可以通过limma包来进行处理,本文主要介绍genepix的芯片处理。示例文...

2022-04-11 20:23:00 2561

原创 背景校正,芯片预处理的第一步!

欢迎关注”生信修炼手册”!对于芯片数据而言,在分析之前,需要先进行背景校正background correct。所谓背景校正,其本质上都是一个减法,将总体信号看做由探针特异性的结合信号(真实信号)和非特异性结合(噪声信号)两部分组成,背景校正的工作就是从总体信号中减去噪声信号,从而得到真实信号。具体到应用层面,有多种算法可供选择,在limma包中,通过background...

2022-04-08 20:28:00 155

原创 原始数据不仅有GEO, 还有ArrayExpress!

欢迎关注”生信修炼手册”!和GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据,网址如下>https://www.ebi.ac.uk/arrayexpress/数据来源于下图所示的两个部分第一部分是由科研工作者提交的数据,第二部分是从GEO数据库自动导入的数据。在NAD代谢相关的文章中,就提到了来自该数据库的原...

2022-04-06 20:28:00 358

原创 公共数据库挖掘第一步-GEO数据库下载表达谱数据和生存数据

欢迎关注”生信修炼手册”!在NAD+代谢相关基因的文章中,针对来自GEO数据库的ALS患者的表达谱数据进行了挖掘,本文就以这两批GEO数据为例,来详细展示原始数据的下载过程公共数据库的数据挖掘有多种模式,每种模式需要的原始数据也不尽相同。所以,首先我们要明确目标,对于这个基因建模而言,我们需要以下两种数据1. 基因表达谱2. 患者的生存数据明确目标之后,我们就可以针对的来...

2022-04-01 20:27:00 6950

转载 文献阅读:NAD+代谢相关基因在肌萎缩侧索硬化症中的预后研究

欢迎关注”生信修炼手册”!文章链接:https://www.frontiersin.org/articles/10.3389/fcell.2022.831273/full文章标题Circu...

2022-03-09 20:30:00 129

转载 基因集泛癌分析,强势来袭!!高分必选!!

本团队最近筛选到一些比较好的基因,需要对单基因泛癌做深入分析的请与本团队联系,先到先得。1.快来看看7+的单基因-泛癌-纯生信怎么做,一看就会!2.单基因泛癌发7+!可复现性极强!你值得拥...

2022-01-13 18:00:00 1440

转载 提速2920倍!用AutoDock Vina对接2800万个分子

AutoDock Vina是用于分子对接和虚拟筛选的开源程序,由Scripps研究所分子图形实验室的Oleg Trott博士设计和实现,是目前使用最为广泛的分子对接软件之一。分子对接技术,...

2021-12-02 20:32:00 414

转载 肿瘤/非肿瘤/单基因/单细胞/非编码:史上最全生信分析攻略!!!

解读生信之美,探讨每篇文献背后的逻辑非肿瘤专栏:条条大路通罗马1.4+非肿瘤生信分析+铁死亡/焦亡/自噬/代谢/免疫的万能钥匙短评:适合一些热门机制如铁死亡/焦亡/自噬等在非肿瘤疾病中的研...

2021-11-03 18:00:00 3946

转载 一对一指导 ,包教会,系统学单细胞测序、chipseq、RNAseq、Atacseq、R语言)线上会议 10月5日开始...

欢迎新老客户预定玮瑜消费预存卡详情咨询谢先生13611825136我们承诺1,包教会,学不会一直免费学,直到您完全学懂、学会、学透彻毕业2,课后建群有完善的一对一指导服务,保证解决每个...

2021-10-13 20:28:00 539

转载 一对一指导 ,包教会,系统学单细胞测序、chipseq、RNAseq、Atacseq、R语言)线上会议 10月5日开始...

欢迎新老客户预定玮瑜消费预存卡详情咨询谢先生13611825136我们承诺1,包教会,学不会一直免费学,直到您完全学懂、学会、学透彻毕业2,课后建群有完善的一对一指导服务,保证解决每个...

2021-09-23 20:38:00 436 1

转载 推荐几个出论文的好方向!!

搞AI,很容易进入一个误区,就是只钻研自己的代码是否精进,而没有注意提升自己的阅读能力。实际上,一个专业的学术研究员或者AI研究员可能需要花费几百个小时来阅读论文,阅读论文可以帮助你深入原...

2021-08-10 20:28:00 293

转载 1分钟告诉你用MOE模拟200000个分子要花多少钱

MOE(Molecular Operating Environment)是加拿大化学计算集团公司Chemical Computing Group Inc.开发的一套计算机辅助药物分子设计的...

2021-08-03 20:36:00 763

转载 2天让你从零基础到手握3-5生信热点分文章 线上课程8月7-8日

欢迎新老客户预定玮瑜消费预存卡详情咨询谢先生13611825136如你没时间参加 朋友圈转发2小时发送截图,或介绍学员,核实后可在授课结束后获得 PPT《WGCNA分析流程指南》 一份。...

2021-07-30 20:34:00 571

转载 我们计划招收300位生信人,免费攻读发论文技巧!

非常感谢大家对我们的长期关注和喜爱,SCI是我们完成学业或是晋升的拦路虎了,专业学习和训练,可以大幅度提高我们科研的效率,所以我们给大家赠送5门关于科研技巧学习(生信发文、数据库、文献阅读...

2021-07-29 10:37:11 142

转载 总结:自学 AI 的高效学习路线

人工智能薪资高、人才缺口大,2021年AI岗的增长率预计达344%,平均月薪14K,现在入行AI也不算晚。但是,往往我们在自学AI的时候,常常会遇到一些问题:· 网上资料太多,不知如何...

2021-07-23 20:54:20 173

转载 零代码撰写生信文章的套路!你没学会算我输!

心急的伙伴,可划到文末直接免费领取【生信神器】上次给大家介绍了仙桃生信工具,一个只需15分钟就能复现生信文章的神器,还全都是零代码!后台至今都还收到小伙伴们的“催(jia)更(liang)...

2021-07-21 20:42:00 864

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除