自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微生信

0代码在线绘制130+科研图

  • 博客(94)
  • 收藏
  • 关注

原创 棒棒糖图展示GO本体论富集分析结果

棒棒糖图展示GO富集分析结果。每个GO术语用一根竖线表示,竖线的高度为-log10(p),表示统计显著性。圆圈中的数字表示注释到特定GO术语的差异表达基因的个数。圆圈的颜色表示GO的3个类别:BP,CC,MF。

2024-07-15 11:46:59 654

原创 根据KEGG官网,将pathway分析结果进行二级分类汇总,轻松找到感兴趣通路

做完通路分析,拿到几十条富集通路后,我们经常会寻找与“某关键词”相关的通路。例如与癌症相关的通路,与免疫相关的通路,与代谢相关的通路等。单纯从名字来看,面对几十甚至上百个英文通路名,一时半会分不清。通过利用KEGG官网的pathway二级分类对富集结果进行汇总,可以帮助我们快速找到感兴趣的通路,例如癌症相关通路,免疫相关通路等。

2024-07-15 11:15:20 839

原创 冲积图(alluvial plot)展示竞争性内源RNA(ceRNA)网络

Alluvial plot(冲积图)是一种流程图,最初设计用于展示网络结构随时间的变化。这种图表特别适用于展示数据中的分类如何从一个组别流向另一个组别,例如在分析不同子类型样本中的细胞如何在不同聚类中分布,或者在不同数据集中的细胞如何在不同聚类中分布的情况。Alluvial plot 通过水平或垂直的流带(ribbons)来表示数据流,这些流带的宽度可以表示数据量或者数据的比例。在R语言中,可以通过ggalluvial包来创建这种图表。

2024-07-12 19:57:18 786

原创 2200+种SCI期刊论文配色方案,总有一款适合您

期刊论文配色如同穿衣打扮,美颜相机。为了让您的论文更专业、更美观、更有吸引力(大白话:增加接受率),我们将ggsci、pypalettes等包中的颜色集去重、汇总,整理了一个可以在线查询2200+种配色的网页。不用学配色,照样做出高质量图片。

2024-07-12 19:18:42 621

原创 渐变树图(treemap)展示GO、KEGG富集结果

富集分析(Enrichment Analysis)是生物信息学研究中最常用的统计方法,主要应用于分析高通量实验(如基因芯片、RNA-Seq、蛋白质组学等)所获得的基因或蛋白。使用树图展示富集分析结果,将文字和颜色放在一起,能够在一定程度上突出显著的结果。

2024-07-08 23:29:48 817

原创 桑基气泡图 – 5个维度展示KEGG通路富集结果

2022年发表在《Nature communication》上的文章Kir2.1-mediated membrane potential promotes nutrient acquisition and inflammation through regulation of nutrient transporters fig1i使用微生信平台绘制了一张图,我们将其命名为“桑基气泡图”。从此,桑基气泡图进入了大家的眼帘,被各公号、平台争相模仿。今天,给大家分享下升级版的桑基气泡图。

2024-07-08 12:22:44 1379

原创 JS网站广告屏蔽插件推荐

JS一直是我们学习知识的来源,上面有非常多的优秀博主和优秀文章。以前基本没有广告,最近确实被JS的广告烦(恶心)到了。本文推荐一款智能屏蔽广告插件。

2024-06-25 10:52:23 161

转载 项目文章:中医药治疗为晚期胃癌患者带来新曙光

胃癌作为一种常见且严重的恶性肿瘤,全球每年有数百万新发病例,尤其在中国,胃癌的发病率和死亡率均为恶性肿瘤中的第三位。胃癌的确切病因尚不完全明确,但研究表明,幽门螺杆菌感染、饮食习惯、遗传因素和环境因素等均与其发生有关。早期胃癌常无明显症状,或仅表现为消化不良、食欲不振等不特异性症状,因而容易被忽视。当癌症进展到晚期时,患者可能出现体重减轻、腹痛、恶心呕吐、黑便等症状。

2024-06-24 11:10:40 25

原创 ToxinPred – 多肽毒性预测、突变设计和理化性质预测

多肽是由多个氨基酸通过肽键连接形成的化合物,是生物体中普遍存在的小分子活性物质,它们作为激素、神经递质、生长因子等参与多种生命活动。近年来,人们对多肽的研究也日渐深入,例如抗菌肽(Antibacterial peptides,ABPs)具有广谱抗菌活性,可以快速杀灭革兰氏阳性菌,革兰氏阴性菌,真菌,寄生虫等。Cecropin类抗菌肽作用于细胞膜,可以形成跨膜离子通道,破坏细胞膜完整性,从而杀死细胞。

2024-06-13 15:19:12 718

原创 piRNA-疾病研究最新综述 – 数据库、软件工具、webserver和计算模型

piRNA被世界顶尖科学期刊《Science》评为2006年年度十大科学突破之一。之后有关piRNA的研究也成为CNS文章的常客。

2024-06-13 13:20:07 877

原创 circlize R包在线绘制圆形热图,bug修复版

之前有热心网友反映,我们的在线绘制环形热图貌似有bug,于是后台查了下代码,经查,果然是bug,并及时向circlize R包大神进行了反馈。

2024-06-11 23:04:19 363

原创 微生信神助力:在线绘制发表级主成分分析(PCA)图

主成分分析(Principal components analysis,PCA)是一种线性降维方法。它利用正交变换对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。PCA是一种对数据进行简化分析的技术,这种方法可以有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。

2024-06-11 22:56:27 805

原创 复现CELL文章图片,在线绘制scRNA-seq多个cluster的差异火山图

​火山图表示两组间的差异,而在scRNA-seq中,同时会有多个cluster(vs其他cluster)的差异。如果用常规火山图展示,可能需要绘制十几个图。有没有更高效的展示方法呢?今天给大家带来CELL文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”中展示scRNA-seq差异基因的多组火山图的绘制方法。​

2024-06-03 00:05:00 713

转载 项目文章:转录组测序如何“画龙点睛”?

在科研的路途中,很多小伙伴的内心可能产生过相似的疑惑:在我的科学问题中,需要用到转录组吗?转录组能用在我的研究里吗?本期文章,我们将精选两篇生物转录组项目文章,带领大家重新领略这一项技术,了解它如何在不同的科研领域中发光发热。期望每一位科研同仁在阅读完毕后,都能在自身研究中为转录组测序找到一个清晰而坚定的定位。

2024-05-22 10:27:05 48

原创 根据蛋白质序列,计算其分子量(molecular weight),在线工具,原理和python代码

蛋白质是由许多氨基酸残基通过肽键(一个氨基酸的 α-羧基与另一个氨基酸的 α-氨基脱水缩合形成的化学键)连接而成。蛋白质的分子量(molecular weight)为各个氨基酸的分子量之和,是蛋白质的重要理化参数。单位为Dalton(道尔顿,缩写Da,或D),定义为碳12原子质量的1/12,1D=1/N g,N为阿弗加德罗常数。通常,我们可以使用氨基酸残基数*110大概计算蛋白质的分子量。

2024-05-11 10:49:13 1503 1

原创 推荐4个可用的github国内镜像

Github是全球最大的代码托管云平台,超过1亿用户在平台上分享代码及数据,深受生物信息学软件开发者的喜爱,并且现在发表文章,若涉及到代码,编辑还要求我们把代码及数据存放在github上,以便检查数据的真实性和可重复性,github堪称生物信息学代码界的“GEO”。

2024-05-10 11:15:44 14768 2

原创 同样都是鸾尾花iris数据,为什么PCA图相反?

主成分分析(principle component analysis)是一种线性降维方法。它利用正交变换对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。PCA是一种对数据进行简化分析的技术,可以有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。

2024-05-10 10:38:12 835

转载 高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型

随着高通量测序技术的飞速发展和多组学分析的广泛应用,科研人员在探索生物学奥秘时经常遇到一个令人又爱又恼的问题:如何从浩如烟海的数据中挖掘出潜在的疾病关联靶点?又如何构建一个全面而有效的诊断或预后模型?只有通过优雅的数据挖掘、精致的结果展示、深入的讨论分析,并且辅以充分的湿实验验证,我们才能锻造出一篇兼具深度与广度的“干湿结合”佳作。

2024-05-08 14:07:43 113

原创 批量将GOID转成GO term名并添加BP,MF,CC分类信息

基因本体论(Gene Ontology,GO,https://www.geneontology.org)是一个广泛应用于生物信息学领域的知识库,它提供了一套标准化的词汇和分类体系,用于描述基因功能、细胞组分和生物过程。GO旨在统一科研人员对基因功能的理解,并提供一个共享的语言框架,以促进基因功能注释和数据分析的标准化。

2024-05-07 17:25:14 995

原创 NCBI GEO王炸:GEO2R直接分析RNA-seq数据,几家欢喜几家愁?

GEO2R是NCBI GEO团队针对上传到GEO的芯片数据开发的一款在线差异分析、可视化作图工具,是广大数据分析人员的福音。然而,一直以来GEO2R仅针对芯片数据,对于越来越多的测序数据,只能下载所上传的matrix矩阵,进行分析,若没有上传表达矩阵,或者基因组版本不合适的话,往往还得下载原始数据重新分析,耗时耗力。

2024-05-06 12:02:19 1072

原创 TCGAplot在线版:输入基因,一键绘制TCGA基因表达与TMB相关性雷达图

肿瘤突变负荷(Tumor Mutation Burden,TMB)是指单位长度中检测到的突变总数。这些突变可以是单核苷酸突变,插入缺失等。一般来说,TMB值越高,意味着肿瘤细胞中的突变数量越多。高TMB的肿瘤通常会产生更多的新抗原,使免疫系统更容易识别和攻击肿瘤细胞。此外,不同肿瘤中,TMB 中位值和分布范围也不同。

2024-04-18 14:11:16 737

原创 TCGAplot在线版:输入基因,一键绘制TCGA泛癌肿瘤vs正常box图

TCGA(The Cancer Genome Atlas)收集了大量癌症样本的数据,涉及33种不同癌症、超过 20000个样本,包括外显子组测序、RNA 测序、microRNA 测序、拷贝数变异、蛋白质组和甲基化组,临床信息等数据,研究者可以利用各种生物信息学工具和统计方法来挖掘数据中的有用信息,推动癌症研究的进展。

2024-04-16 10:11:19 1376

原创 TCGAplot在线版:输入基因,一键绘制TCGA基因表达与MSI相关性雷达图

TCGA(The Cancer Genome Atlas)收集了大量癌症样本的数据,涉及33种不同癌症、超过20000个样本,包括外显子组测序、RNA测序、microRNA 测序、拷贝数变异、蛋白质组和甲基化组,临床信息等数据,研究者可以利用各种生物信息学工具和统计方法来挖掘数据中的有用信息,推动癌症研究的进展。

2024-04-15 15:20:12 732 1

原创 微生信 -- 0代码科研绘图,助力发高分文章

微生信云平台以220多款在线绘图、分析模块为基础,致力于0代码在线分析数据,0代码在线绘制科研图片。让不会编写代码的科研工作者,贴贴数据,点点鼠标就能够进行数据分析和科研绘图,沉浸在数据分析和绘图所带来的便捷和喜悦中,助力发文章,发高分文章,为生命科学的发展添砖加瓦。

2023-12-29 22:09:06 912

原创 为什么上传GEO前需要校验fastq文件正确性,并使用md5值验证文件完整性?

Gene Expression Omnibus(GEO)是美国NCBI开发的一个大型综合数据库,它存储了超过500万个样品的芯片/测序原始数据文件。因为数据一般可公开获得且免费使用,所以GEO已经成为生物医学研究者最喜爱的网站之一。芯片或/和测序原始数据上传GEO,分配GEO号,以保证数据的可重复性,几乎是发文必备。

2023-03-05 22:54:26 899 1

原创 使用ChIPSeeker进行ChIP-seq, ATAC-seq,cut&tag等富集峰的基因组注释

常规的下一代高通量测序(next generation sequencing, NGS)实验通常产生大量短片段(reads),通常我们需要将这些reads比对到参考基因组/转录组上,即将它们置于生物学上有意义的基因背景下,才能获得有意义的结果。一般我们认为会产生两种类型的数据(当然两者并无严格意义上的区分)

2023-02-28 21:59:16 1937

原创 如何查找“铁代谢”相关的基因?

铁(iron)是人体必需的微量元素,存在于所有细胞中。除红细胞生成外,铁还参与各种生理和病理过程,例如氧气运输和储存、线粒体功能和免疫系统(Crielaard等,2017)。铁缺乏(iron deficiency)是一种常见的营养障碍(缺铁性贫血),影响全球约1/3的人(Stoltzfus等,2001)。铁缺乏将会影响细胞及组织的氧化还原功能,造成人体多方面的功能紊乱。

2023-02-03 23:30:27 934

原创 将GO、Pathway富集结果整合在一张高颜值圆圈图上

富集分析是生物医学论文中非常常见的一类分析,例如GO富集分析,Pathway富集分析等。其结果一般包括以下几个要素:1,名字(GO term或者KEGG description);2,该名字所包含的基因数目;3,该名字所包含的基因与进行富集分析的输入基因的重叠数目;4,富集的P值、FDR值等。富集结果的常见绘图方式包括:气泡图,条形图,弦图等。今天我们利用circlize R包整合富集结果,绘制一个高大上的圈图。

2023-01-13 12:33:50 2497

原创 在线计算lncRNA-mRNA共表达相关系数,并使用cytoscape绘制共表达网络图

长链非编码RNA(Longnoncoding RNA)是一类长度大于200 nt,不编码蛋白质的RNA。LncRNA的功能多样,如图1所示,A:充当蛋白质和染色质的连接因子,引起染色质重构(chromatin remodeling);B:充当miRNA海绵;C:充当“scaffold”脚手架;D:与转录因子结合,引起转录激活;E:把转录因子拉走,引起转录抑制;FGH:与mRNA结合抑制翻译、调节剪切,及降解mRNA等。

2023-01-11 23:42:36 1783

原创 免费在线绘制高颜值,带填充的连贯堆叠柱状图

堆叠柱状图是我们日常工作中经常使用的一类图形。然而当分类较多时,堆叠柱状图看起来不是那么清晰,通过添加额外的连线,可以增加堆叠柱状图的颜值,给人一种连贯的感觉,并且能够更好地观察数据比例的变化。

2022-12-27 20:11:21 1037

原创 【CELL】compass利用单细胞转录组+流平衡分析预测细胞代谢状态,促进免疫细胞代谢研究

细胞代谢调控正常细胞功能以及多种疾病状态的病理生理。最近,免疫细胞代谢研究(immunometabolism)成为一个研究热点,揭示了包括抗病毒免疫、自身免疫和抗肿瘤反应在内的炎症代谢调节。然而,由于代谢网络的规模和复杂性,某个代谢的扰动(perturbation)能够产生级联效应(cascade effects)并改变代谢网络中看似较远的部分或者让经典通路“弯道超车”。因此,需要在系统水平上观测特定反应/酶,以理解代谢及其在疾病中的异常调控。

2022-12-15 00:49:38 1054

原创 在线绘制富集分析多组气泡图和单细胞分析marker基因矩阵气泡图

常规的GO或者KEGG通路富集分析结果通常以气泡图的形式展示,然而这个气泡图仅仅是一个比较的结果,如果想在一张图上展示多个比较的结果,就需要用到多组气泡图(图1,左侧)。单细胞RNA-seq分析结果中,矩阵形式的气泡图可以很好地展示marker基因(X轴)在不同cluster(Y轴)中的表达情况(图1,右侧)。

2022-12-09 12:32:10 2125

原创 画饼画到世界地图上:按比例呈现多组数据

地图是数据可视化的一部分,做群体遗传学、动物学、植物学、微生物学等的朋友经常用到世界地图,比如绘制不同小麦品种的世界分布。一般情况下,我们根据经纬度将数据标注在地图上,然而有些时候,我们会需要更高级的标注,例如数据点带有分类和数值属性时,需要将数据点拆分成饼图,让数据内部的比例也呈现出来。饼图+世界地图给我们不一样的体验。发挥想象力,收集你的数据,将带分类的数据点呈现在世界地图上吧!

2022-12-08 22:49:02 582

原创 使用reshape2 R包进行在线长数据和宽数据相互转化

数据是数据分析的基础。我们常见的数据一般存储在excel表格,或者txt文档中。今天我们来看看长数据和宽数据,以及如何进行两者之间的相互转换。

2022-12-06 21:40:49 759

原创 pyinstaller打包python脚本为exe可执行文件实例:错误排查小脚本

根据TIOBE全球编程语言排名,python是目前世界排名第一的编程语言。考虑到代码及数据的保密性,以及其他人电脑上可能没有装python环境,因此我们需要将自己编写的python脚本打包成exe格式的可执行文件发送给其他人使用。小编推荐一款名为pyinstaller的打包库,它可以将.py脚本打包成.exe可执行文件,以脱离python环境使用。

2022-11-22 11:15:52 597

原创 带临床数据的热图 -- 给样品添加TNM分期、年龄、性别、riskscore等信息

聚类热图是生物医学论文中最常见的一类图。通常,一篇研究癌症预后、突变等类型的文章最终都会聚焦到几个或者十几个基因,然后利用这些基因的表达量绘制热图,并尽可能多地在图中展示样品的临床信息,例如TNM(Tumor Node Metastasis)分期、stage、性别、年龄、riskscore等。这时,我们需要在常规热图的基础上,根据某一变量(例如riskscore从小到大)对样品进行排序,然后在热图的顶部添加不同的颜色条,用来表示额外的分组信息,并对颜色条中的颜色块进行标注说明。

2022-11-20 09:51:13 1876

原创 实验送样、数据分析样品、组名命名规范

俗话说巧妇难为无米之炊,而样品就是“米”,没有样品,就无法开展实验,无法获得数据,无法毕业,无法发文章。鉴于样品的重要性,非常有必要对样品进行详细且规范的记录,方便他人也方便自己。以下根据小编工作经验,并参考相关资料,总结下几个样品名、组名命名小技巧,欢迎补充!

2022-11-19 21:32:03 1153

原创 使用DESeq2进行转录组原始count标准化和差异分析

转录组测序完成后,一般我们会获得一个原始 readcount表达矩阵,其中行是基因,列是样品。常用的差异分析工具包括limma、edgeR和DESeq2。DESeq2在测序领域使用最为广泛(google scholar引用高达43284次,edgeR为28076次)。小编今天给大家介绍下我们的在线DESeq2差异分析模块,小伙伴们可以零代码进行GEO数据库表达矩阵的挖掘,后续再利用我们平台的各种绘图模块出图,大大加速了我们的科学研究。

2022-11-14 15:29:31 4873

原创 利用m7Ghub数据库查询并使用iRNA-m7G软件预测RNA m7G修饰位点

什么是RNA m7G甲基化?m7G RNA甲基化是在甲基转移酶的作用下,在鸟嘌呤(G)第七位N上加上甲基的一种化学修饰。m7G修饰是转录后调控中最常见的一种碱基修饰,广泛存在于tRNA、rRNA、以及真核生物mRNA的5’帽子区,对维持RNA的加工代谢、稳定、出核以及蛋白质翻译具有重要作用。

2022-11-02 00:06:15 489

原创 数据为什么要进行log2转化,倍数变化(fold change)为什么要求个log2FC?

今天是2022年10月24日,首先祝所有程序员们(会写、会看代码的都算)节日快乐!1024是2的十次方,二进制计数的基本计量单位之一。做生信分析的小伙伴就像是一个个1024,用最低调、最踏实、最核心的功能模块将计算机程序应用到生命科学中,促进科学发展。1G=1024M,而1G与1级谐音,做生信分析的小伙伴都是一级棒的!

2022-10-24 13:19:45 11817

微生信GOID批量转名字并添加BP,MF,CC分类

微生信GOID批量转名字并添加BP,MF,CC分类:调用GO obo文件中的信息,批量将GOID转成GO term并添加分类信息。

2023-09-19

微生信平台桑基气泡图绘制教程

微生信平台桑基气泡图以5个维度展示基因富集分析结果。视频介绍了该图的意义,并使用示例数据展示了如何绘制,及如何进行后期编辑。

2023-03-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除