R
刘永鑫Adam
刘永鑫,中国农科院基因组所研究员,iMeta期刊执行主编,宏基因组公众号创始人。主要研究方向为微生物组研究方法、食品组与微生物组功能研究和科学传播,在Science、Nature Biotechnology、Nature Microbiology、Cell Host & Microbe等期刊发表论文40余篇,被引9000余次。主编《微生物组实验手册》专著,由300多位同行参与,共同打造本领域长期更新的中文百科全书。创办宏基因组公众号,14万+同行关注,分享原创文章3千余篇,累计阅读量超3千万,打造本领域最具影响、服务同行的科学传播平台,免费发布您团队的成果、方法、经验、招生招聘,欢迎投稿。
展开
-
ggplot2版聚类物种丰度堆叠图
文章目录写在前面加载依赖关系导入数据ggtree绘制聚类树物种组成数据整理成facet需要的格式保证颜色填充独立性分面组合树和柱图修改配色ggtree调整布局添加样本其他信息树+柱+堆叠图组合猜你喜欢写在后面写在前面随着研究的逐渐深入,我们对绘图的要求越来越高,各种之前使用的较少的图形如今追求热度和新颖程度,都开始逐渐在大文章中显现。如下图。这是最近刚发表于Nature Ecology &...原创 2020-04-16 23:49:31 · 12717 阅读 · 0 评论 -
差异分析完整解决方案
文章目录写在前面EasyAovWlxPlot 使用指南安装EasyAovWlxPlot包导入包基于单个指标的统计分析正态检验和方差齐性分析NorNorCVTest方差分析(aovMcomper)非参数检验(KwWlx)柱状图展示方差分析或非参数检验结果(aovMuiBarPlot)箱线图展示方差分析或非参数检验结果(aovMuiBoxP)多指标统计分析多个指标同时做正态检验和方差齐性分析(MuiN...原创 2020-02-14 15:49:43 · 3338 阅读 · 1 评论 -
MIMOSA2: 基于微生物组和代谢组数据的整合分析
文章目录MIMOSA2: 基于微生物组和代谢组数据的整合分析MIMOSA2的工作原理MIMOSA2分析的主要步骤软件部署我们来看看MIMOSA2究竟做了什么?运行计算模式1:基于Greengenes OTU的结果和EMBL模型模式2:基于Greengenes OTU和AGORA模型模式3:基于ASV和EMBL模型模式4:基于ASV和AGORA模型结果说明表格1: 微生物对代谢物的贡献表格表格2:原...原创 2020-02-13 22:16:39 · 7364 阅读 · 0 评论 -
手把手重现Science的主图Maptree
文章目录手把手重现Science的主图-Maptree写在前面输入文件开始运行初步绘制maptree图形按照物种分类信息上色按照OTU差异进行上色补充一 : ggraph版本的物种分类树猜你喜欢写在后面手把手重现Science的主图-Maptree写在前面最近一篇Science的图表中第一幅主图使用圆堆积图(circle packing chart,是树图Treemap/Maptree的一种...原创 2020-01-01 11:59:41 · 2472 阅读 · 2 评论 -
重现2篇Nature中GraPhlAn绘制的超高颜值物种树Cladogram
GraphLan绘制教程我们经常在文章中看到这样的图Yang Bai, Daniel B. Müller, Girish Srinivas, Ruben Garrido-Oter, Eva Potthoff, Matthias Rott, Nina Dombrowski, Philipp C. Münch, Stijn Spaepen, Mitja Remus-Emsermann, Bru...原创 2019-11-28 19:12:17 · 8584 阅读 · 0 评论 -
R语言统计入门课程推荐——生物科学中的数据分析Data Analysis for the Life Sciences
Data Analysis for the Life Sciences是哈佛大学PH525x系列课程——生物医学中的数据分析(PH525x series - Biomedical Data Science ),课程全部采用R语言进行统计分析理论教学与实战。教材采用Rmarkdown语言编写,易轻松易读,又保证分析的可重复性,代表了科学界最先进的可重复计算要求,我们不仅可以系统学习一个生物学...原创 2018-08-31 00:13:13 · 4856 阅读 · 1 评论 -
SourceTracker—微生物来源分析
前一阵我们翻译Rob Knight的综述,1.8万字,让你熟读2篇轻松握微生物组领域分析框架、把握未来分析趋势。目前在宏基因组平台累计过万人次,热心肠平台首发阅读7600+,科学网加精置顶阅读6500+,三大平台阅读人数超过2.5万余次。还没有仔细学习的,赶快读两遍吧!Nature综述:大佬手把手教你分析菌群数据——1.8万字其中提到了一款追踪微生物来源的软件SourceTrack...原创 2018-08-16 23:00:30 · 16630 阅读 · 7 评论 -
基础004:R语言数据处理和变换——dplyr
dplyr背景简介安装和数据准备常用函数变量筛选select数据筛选filter排序arrange创建新变量mutate本文“植物微生物组”公众号原创,ID: plantmicrobiome作者:秦媛原文链接:基础004:R语言数据处理和变换——dplyr(1)dplyr背景简介在处理数据的过程中,经常需要根据需求从完整的实验设...原创 2018-08-07 19:43:14 · 3741 阅读 · 0 评论 -
Basic005. Intro to statistics basic terms统计名词介绍
本文“植物微生物组”公众号原创,ID: plantmicrobiome作者:Tank原文链接:Intro to Statistics with R (HarvardX series PH525x)Introduction to Random Variables这个哈佛大学的 PH525x公开课相对基础通俗也不失其专业性,适合生统生信领域甚至纯生物背景的人士自学,整个系列教程结合...原创 2018-08-07 19:36:13 · 499 阅读 · 0 评论 -
手把手带你重现菌群封面文章全部结果图表
文章简介图表解读与绘制1. 水稻根系微生物随时间变化吗?2. 微生物组随时间变化的规律3. 哪些菌门随时间呈现规律变化呢?4. 哪些菌可以作为生育时间的biomarkers?猜你喜欢写在后面文章简介人类体内和植物根系都存在着数量庞大种类繁多的微生物群落(微生物组)。肠道微生物组随人类年龄的演化规律关系到人们的健康。与之类似,植物根系微生物组随植物生...原创 2018-06-26 22:58:36 · 5201 阅读 · 0 评论 -
R,Git和Github(上)
作者:Wenhu 博客:http://bioinfostar.com/ 本讲为第一部分,介绍git的“足够你用”命令;第二部分,还将介绍github的主要用途以及如何在R中使用git,部分内容改编自廖雪峰的《Git教程》。源代码:https://github.com/mckf111/mckf111.github.io/tree/master/_postsGit是啥正统...原创 2018-06-17 22:00:39 · 2843 阅读 · 0 评论 -
用iTOL网站快速绘制颜值最高的进化树!
文章目录iTOL简介iTOL的基本使用流程:怎么样才算是一颗高颜值的进化树呢?制作注释文件Windows软件安装Linux软件安装准备输入文件生成注释文件注释文件美化方案1. 属名称多分类层级方案2. 丰度柱状图方案3. 热图方案4猜你喜欢写在后面本文“宏基因组”公众号原创作者:中科院微生物所 周欣iTOL简介大家在看高分文章时,总会惊叹于,为什么人家能做出那么好看而且高大上的系统发育树,...原创 2018-09-28 08:06:52 · 12699 阅读 · 12 评论 -
R语言:聚类分析hclust
# 生成测试数据# 产生0-1之间均匀分布Uniform Distribution的数值x = runif(10)y = runif(10)# 得到2维的数组:按列合并S = cbind(x,y)# 赋予名称,便于识别分类:生成Name1-Name10的系列名赋予数组行名rownames(S) = paste("Name",1:10,"")# 数值计算距离out.dist=di...原创 2018-12-08 21:06:07 · 26232 阅读 · 1 评论 -
R语言:生成正态分布数据生成--rnorm,dnorm,pnorm,qnorm
norm是正态分布,前面加r表示生成随机正态分布的序列,其中rnorm(10)表示产生10个数;给定正太分布的均值和方差,Density(d), distribution function§, quantile function(q) and random® generation for the normal distribution with mean equal to mean and st...原创 2018-12-08 22:05:31 · 81639 阅读 · 1 评论 -
R语言:数据筛选match
数据筛选是在分析中最常用的步骤,如微生物组分析中,你的OTU表、实验设计、物种注释之间都要不断筛选,来进行数据对齐,或局部分析。今天来详解一下此函数的用法。matchmatch:匹配两个向量,返回x中存在的返回索引或TRUE、FALSEmatch函数使用格式有如下两种:第一种方便设置参数,返回x中元素在table中的位置match(x, table, nomatch = NA_inte...原创 2018-12-09 13:27:37 · 31665 阅读 · 0 评论 -
使用ComplexHeatmap包绘制个性化热图
文章目录使用ComplexHeatmap包绘制个性化热图检测安装加载包创建测试数据集一行命令绘图调参美化猜你喜欢写在后面使用ComplexHeatmap包绘制个性化热图作者:刘梦瑶 诺禾致源 微生物信息审稿:刘永鑫 中国科学院遗传与发育生物学研究所ComplexHeatmap包由顾祖光博士创建,是一个非常全面的绘制热图的R包,可以利用它来绘制许多文献中的美图,例如下图展示的16S文献分析中...原创 2019-02-12 10:14:09 · 10066 阅读 · 0 评论 -
R包circlize:柱状图用腻了?试试好看的弦状图
文章目录柱状图用腻了?试试好看的弦状图弦图简介数据准备代码部分载入R语言包数据导入颜色设定画图保存以上图片Circlize包的所有参数(个性化设置)笔者个性化弦图作者简介猜你喜欢写在后面柱状图用腻了?试试好看的弦状图作者:郑伟 西北农林科技大学责编:刘永鑫 中科院遗传发育所弦图简介总体来讲,弦图是一种可视化微生物物种或基因相对丰度的方法。平时大多数时间我们看到的文章一般都用柱状图表示微生...原创 2019-03-25 17:03:38 · 10415 阅读 · 22 评论 -
价值1143元的《R语言统计分析微生物组数据(Statistical Analysis of Microbiome Data with R)》系列图书
文章目录《R语言统计分析微生物组数据》本书简介作者简介章节简介猜你喜欢写在后面《R语言统计分析微生物组数据》Statistical Analysis of Microbiome Data with R京东上原版图书售价1143元https://item.jd.com/35082777085.htmlhttps://link.springer.com/book/10.1007/978-...原创 2019-05-19 21:45:12 · 2892 阅读 · 0 评论 -
R语言一键批量完成差异统计和可视化
文章目录R语言一键完成差异检测从数据到展示单因素**差异**分析的完整方案方案优点引子单因素差异检测完整方案实现思路主要函数解读两种差异表示方案及其代码字母标记箱线图代码ggpubr + 箱线图 + 连线差异标注实战导入需要的包导入数据选择可视化方案运行函数结果文件展示选择Tukey多重比较方法写在后面猜你喜欢写在后面撰文:文涛 南京农大责编:刘永鑫 中科院遗传发育所R语言一键完成差异检测从...原创 2019-06-10 23:23:57 · 9329 阅读 · 19 评论 -
R语言大会:宏基因组数据分析和可视化套路总结
2019年5月25日,我应邀参加在人民大学召开的R语言大会。《5月24-26日,第12届中国R会议(北京)可视化专场》作题为《R语言在宏基因组数据统计分析及可视化中的应用》。虽然报告时间是早点8点半,但现场坐无虚席,后面过道都站满了人。现在80多位朋友也通过面对面建群的方式获得了课件。后来有朋友联系我索要报告PPT,还告诉了我报告有在线视频。现将报告的PPT和现场转播的视频分享给大家。...原创 2019-06-16 17:30:51 · 4071 阅读 · 0 评论 -
水稻微生物组时间序列分析4-随机森林回归
写在前面哪些菌可以作为生育时间的biomarkers?回归分析读取文件随机森林回归交叉验证feature重要性美化feature贡献度柱状图图4.2. 绘制时间序列热图猜你喜欢写在后面写在前面之前分享了3月底发表的的 《水稻微生物组时间序列分析》的文章,大家对其中图绘制过程比较感兴趣。一上午收到了超30条留言,累计收到41个小伙伴的留言求精讲。...原创 2018-06-25 00:23:42 · 8141 阅读 · 2 评论 -
水稻微生物组时间序列分析2b-散点图拟合
写在前面图2. 微生物组随时间变化的规律图2. E-F散点图拟合展示距离变化猜你喜欢写在后面写在前面之前分享了3月底发表的的 《水稻微生物组时间序列分析》的文章,大家对其中图绘制过程比较感兴趣。一上午收到了超30条留言,累计收到41个小伙伴的留言求精讲。我们将花时间把此文的原始代码整理并精讲,祝有需要的小伙伴能有收获。本系列按原文4幅组图,共分为4节。...原创 2018-06-17 08:31:42 · 1514 阅读 · 4 评论 -
ggplot2:9绘图需要的数据整理技术-数据转换
ggplot2绘图基础系列: - 1初识ggplot2绘制几何对象 - 2图层的使用—基础、加标签、注释 - 3工具箱—误差线、加权数、展示数据分布 - 4语法基础 - 5通过图层构建图像 - 6标度、轴和图例 - 7定位-分面和坐标系 - 8主题设置、存储导出# 加载本文所需包library(lubridate)library(magrittr)library(dply...原创 2018-06-02 11:33:15 · 3658 阅读 · 0 评论 -
R语言添加p-value和显著性标记
R语言添加p-value和显著性标记,原文链接 https://mp.weixin.qq.com/s/gRw0krS3LY7c0QK9y47EJw作者简介 Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/往期回顾一条命令轻松绘制CNS顶级配图-ggpubrR语言聚类分析–cluster, f...转载 2018-02-18 13:34:20 · 55277 阅读 · 3 评论 -
ggalluvial:冲击图展示组间变化、时间序列和复杂多属性alluvial diagram
感谢“宏基因组0”群友李海敏、沈伟推荐此包绘制堆叠柱状图各成分连线:突出展示组间物种丰度变化。冲击图(alluvial diagram)是流程图(flow diagram)的一种,最初开发用于代表网络结构的时间变化。实例1. neuroscience coalesced from other related disciplines to form its own field. From...原创 2018-02-17 14:47:48 · 11124 阅读 · 0 评论 -
R语言交互式可视化包CanvasXpress
作者简介刘永鑫,博士。2008年和2011年毕业东北农业大学微生物学和作物遗传育种专业。2014年在中科院遗传发育所获生物信息学博士学位,2016年博士后出站留所工作,任宏基因组学实验室工程师,目前主要研究方向为宏基因组学数据分析方法、培养组学方法优化。2017年7月创办“宏基因组”公众号,目前关注人数1.5万,累计阅读超百万。公众号:宏基因组(meta-genome)往期回顾扩...原创 2018-02-15 11:17:13 · 1601 阅读 · 0 评论 -
视频教程:R语言recharts包绘制交互式图形
写在前面你见过随月份变化的温度拆线图你还见过可以鼠标点选显示详细信息、开关分组的散点图互联网中铺天盖地的词云线图、柱状图、堆叠图任意切换,不再为选择类型纠结甚至是随心所欲的力导向布局图今天不是带你来看图,而是带你画图的。只安成功安装recharts包,半小时带实现以上全部图型。视频教程相关内容太多,文字传达不便,故录了一个小视频,帮助大家理解原创 2018-02-07 14:15:10 · 4288 阅读 · 0 评论 -
R语言聚类分析--cluster, factoextra
R语言聚类分析–cluster, factoextra本文转载自“R语言中文社区”,己获授权,宏基因组公众号编辑对内容进行测试、修改及补充。原文链接:https://mp.weixin.qq.com/s/M_rJqcHz6HUlGIHVeN4RkQ对于有很多(成百上千)研究对象时,把对象分组是最常用的研究手段。而通过观察值进行聚类是非常有效的方法,可以按事物观察值有效的合理分组,再进一转载 2018-02-06 20:50:28 · 54887 阅读 · 8 评论 -
编程模板-R语言脚本写作:最简单的统计与绘图,包安装、命令行参数解析、文件读取、表格和矢量图输出
写在前面个人认为:是否能熟悉使用Shell(项目流程搭建)+R(数据统计与可视化)+Perl/Python等(胶水语言,数据格式转换,软件间衔接)三门语言是一位合格生物信息工程师的标准。之前分享过我个人的Shell语言和Perl语言脚本写作模板,今天再分享一下我的R语言模板,一次性解决困扰新手的众多问题,如包安装、命令行参数解析、文件读取、Anova组间统计和箱线图展示、表格和矢量图输出等原创 2018-01-18 22:54:04 · 3916 阅读 · 0 评论 -
16S预测宏基因组最强R包-Tax4Fun
之前在公众号的文章《根据16S预测微生物群落功能最全攻略》阅读人数近3000人,有需求的用户还是非常多的。其中提到了4个软件,之前已经介绍了其中非常有特点的三种,分别为: - PICRUSt预测宏基因组: 优点是高引流行,但缺点是数据太旧,GreenGene数据库13年5月后再无更新。 - FAPROTAX预测元素循环:主要基于物种名预测元素循环相关功能。 - bugbase预测细菌表型:主要原创 2018-01-03 09:46:18 · 18704 阅读 · 6 评论 -
ggrepel-解决散点图样品标签重叠,方便筛选样品
ggrepel解决标签之间重叠问题简介有时样本比较多,而我们想在图形中添加标签的时候,容易出现标签遮盖的问题。尤其是在扩增子研究中,在相同基因型、环境条件宿主(温室植物、饲养动物)至少也需要6次以上生物学重复,如人类这种无法控制基因型和生活环境的研究对象,实验组至少30个起才容易发现有统计为意义的差异菌。而在样品比较、样品筛选时又必须看清这些点名字,用于筛选掉一些记录错误、未报抗生素使用或隐性疾病等原创 2018-01-02 20:13:12 · 12503 阅读 · 1 评论 -
一条命令轻松绘制CNS顶级配图-ggpubr
本文转载自“EasyChart”,己获授权。本平台编辑对内容进行测试、修改和补充。Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解ggplot2的人来说就有点困难了,ggplot2的部分语法是很晦涩的。为此Alboukadel Kassambara创建了基于ggplo转载 2017-12-27 12:34:10 · 7954 阅读 · 1 评论 -
riverplot绘制桑基图
桑基图是一种方便说明信息、资源流动和图形,图形中的分、合正如漂流的分叉与汇合,如可用于比较不同簇间关系,可以用来表示各个节点之间转换。Sankey plots are a type of diagram that is convenient to illustrate how flow of information, resources etc. separates and joins, mu...原创 2018-02-22 16:09:48 · 6859 阅读 · 0 评论 -
R画月亮阴晴圆缺:corrplot绘图相关系数矩阵
今天是十五元宵节,即是和家人团聚的机会,也是赏月的好日子。 但作为科研汪的我,在狗年应更加努力,争取在狗年旺旺,从加班狗中脱颖而出。分享一个相关分析可视化实战,祝大家元宵节快乐!先给大家送一个我画的假蓝月亮,不管你看着像不像,反正我觉得像。之前我们分享了关于相关分析的原理,还有ggcorrplot包的使用。相关性分析方法基础:Spearman、Kendall和Pear...原创 2018-03-01 22:10:22 · 24669 阅读 · 3 评论 -
microbiomeViz:绘制lefse结果中Cladogram
本文为R包microbiomeViz作者李陈浩原创,博文链接见文末。作者授权发布于本平台,刘永鑫对本文进行测试,有修改。为啥写这个平日经常会分析shotgun宏基因组的数据,我们的pipeline使用MetaPhlAn,Kraken等profiler。这种数据经常会产生一个表格,如下download.file("https://bitbucket.org/biobakery/bio...原创 2018-06-09 11:08:50 · 8504 阅读 · 2 评论 -
水稻微生物组时间序列分析3-冲击图展示时间序序列变化
写在前面图3. 哪些菌门随时间呈现规律变化呢?绘图实战清空工作环境和加载包读入实验设计、OTU表和物种注释筛选高丰度门用于展示数据交叉筛选按样品绘图按组绘图绘制冲击图alluvium猜你喜欢写在后面写在前面之前分享了3月底发表的的 《水稻微生物组时间序列分析》的文章,大家对其中图绘制过程比较感兴趣。一上午收到了超30条留言,累计收到41个小伙...原创 2018-06-20 23:33:50 · 2619 阅读 · 2 评论 -
R语言常用函数:交集intersect、并集union、找不同setdiff、判断相同setequal
交集intersect并集union找不同setdiff判断相同setequal猜你喜欢写在后面在R语言进行数据分析时,经常需要找不同组间的相同和不同,那你应该掌握如下几个函数,让你事半功倍。交集intersect两个向量的交集,集合可以是数字、字符串等# 两个数值向量取交集intersect(x=1:4, y = 2:6)# [1] 2 3 4...原创 2018-05-29 12:08:44 · 127231 阅读 · 3 评论 -
RandomForest:随机森林预测生物标记biomarker——分类
随机森林简介R randomForest包安装与加载分类Classification分类结果主坐轴分析随机选取2/3预测,1/3验证无监督分类分层抽样Reference猜你喜欢写在后面随机森林简介如果读者接触过决策树(Decision Tree)的话,那么会很容易理解什么是随机森林。随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元...原创 2018-04-24 22:22:49 · 10390 阅读 · 0 评论 -
RandomForest:随机森林预测生物标记biomarker——回归
关于随机森林的简介和应用理论,请阅读之前分享的文章:一文读懂随机森林在微生态中的应用关于随机森林进行分类的入门实战,请阅读 之前分享的 - 《RandomForest:随机森林预测生物标记biomarker——分类》,大家可以学习此文,实现分组挖掘两组或多组的特异Features,也可以展示特征的贡献度,获得分类评估的准确度,以及使用新数据进行预测,无监督的随机森林等基础技能。...原创 2018-04-30 23:54:49 · 7821 阅读 · 1 评论 -
水稻微生物组时间序列分析精讲1-模式图与主坐标轴分析
写在前面上周五我们分享了3月底发表的的 《水稻微生物组时间序列分析》的文章,大家对其中图绘制过程比较感兴趣。一上午收到了超30条留言,累计收到41个小伙伴的留言求精讲。我们也争取花时间把此文的原始代码整理并精讲,祝有需要的小伙伴能有收获。本系列按原文4幅组图,共分为4节。本文是第一节,模式图与主坐标轴分析。先回顾一下图1的内容。图1. 水稻根系微生物随时间变化吗?...原创 2018-04-19 14:36:13 · 3298 阅读 · 5 评论