自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(74)
  • 资源 (6)
  • 收藏
  • 关注

原创 单细胞数据读取(二)之Read10X读不出来dgCMatrix报错

前面我们也遇到过10x的数据读取不进去,如果大家遇到下面的报错,可以通过修改10x的原始重新读取,详细可以见链接https://blog.csdn.net/weixin_43949246/article/details/121225791当然,这次跟大家说的是另一种10x的数据,同样的,我们先说报错,如果出现dgTMatrix的报错,我们该怎么办呢?这里给大家推荐一种解决方法,首先先定义个函数,修改读取的方式read10x_ymc <- function( data.dir = NULL

2021-11-18 13:16:59 327

原创 单细胞10x的数据读取不进去怎么办?

面对越来越多的单细胞数据被上传至NCBI上,单细胞数据挖掘分析也逐渐走入大家的眼中。如何寻找一个合适的单细胞数据用于后续非常重要,这时候大家可能会经常遇到这么一个问题,一个标准的10x的数据,为什么我怎么也读取不进去呢?,这里我们以GSE163974数据为例。首先,进入NCBI,下载该数据集https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi下载之后解压一个一个样本一个文件夹,如GSM4994385样本修改文件名这时候,打开Rstudio#修改工作

2021-11-09 13:36:35 401

原创 一个横空出世用于下载TCGA、GEO、ICGC数据于一体的工具

数据挖掘已越来越广为人知,甚至,生信分析在近几年来被推入了一个新的发展的高潮。而对于数据的下载也越来越受到很多的关注了。目前用的最多的数据库有三个,TCGA、ICGC和GEO的数据。我们都知道这三个数据库的数据下载的方法有很多很多,如TCGA有用官网下载的,有用R语言下载的等等。但是不管怎么样,没有一个网站将这三个数据库的数据下载方式集于一身!sangerbox,一个近几年非常火的一个在线网站!网址:http://vip.sangerbox.com/如果仅仅是下载数据当然不需要成为会员,我们可以点

2021-10-20 22:17:08 151

原创 如何从ImmPort下载免疫相关的基因集

首先进行管网https://www.immport.org/home选择gene list选择gene summary该列表的基因即是所有的免疫相关的基因集

2021-10-13 22:15:01 70

原创 linux空间共享Windows

如何将linux上某一个文件可以直接映射到windows呢?1、安装samba软件yum -y install samba samba-client修改内容vim /etc/samba/smb.conf#See smb.conf.example for a more detailed config file or#read the smb.conf manpage.#Run ‘testparm’ to verify the config is correct after#you modi

2021-09-07 21:10:22 110

原创 NFS---linux远程挂载

如何在一台服务器上挂载另一台服务器上的某个空间。1、安装软件nfsyum -y install nfs-utils rpcbind2、设置开机自动启动服务chkconfig nfs onchkconfig rpcbind on3、启动服务service rpcbind startservice nfs start我们这里有两台服务器,将119的data1共享给120首先在119的服务器上创建一个linux_share的文件夹mkdir /linux_share设置权限chm

2021-09-07 20:57:04 26

原创 R语言去重的方法

R语言去重的方法有很多,这里介绍一种简单的方法1、所有重复的全部去除一个不留index<-duplicated(data.set$Ensembl.Gene.ID)data.set2<-data.set[!index,] 2、非重复的保留,重复的取平均值data<-aggregate(.~Ensembl.Gene.ID,data,mean)3、非重复的保留,重复的取中位数data<-aggregate(.~Ensembl.Gene.ID,data,median)

2021-09-07 20:40:55 178

原创 windows下安装R包的三种方式

R包的存在基本上可以分为三种形式,第一种是存在于cran上的,第二种bioconductor上,第三种存在于github中。一、cran的包1、在线安装install.packages('',chooseCRANmirror(graphics=FALSE))install.packages('R包'),选择镜像即可2、手动安装如果安装一直失败,这时候可以手动安装,手动安装需要下载安装包,这里以XML包为例https://cran.r-project.org/web/packages/XML/

2021-09-06 23:02:17 477 2

原创 一个可以实现图片格式相互转化的工具convert_picture.exe

最近一直在忙着写html,在抓取图片的过程中,发现html默认只能显示png等格式,像tiff和tif都无法正常显示,但是数据分析过程中,生成的全是tiff的图片格式,难道要我改数据分析的流程,一个一个转!这太难了,一想到就害怕,这时候我就在想能不能找到一个合适的工具可以实现图片之间的一个互换。我查了一圈,试了好几个,结果都不是很好用,一气之下,小编决定自己写一个线下版可以永久免费的小工具。首先在使用该工具前,先确定自己的电脑安装了python的环境,而且要求python版本要在3.8及以上才可以。在压

2021-04-29 17:37:37 138

原创 根据基因或者蛋白的id提取序列---extract_seq.exe

在面对需要提取某一个基因的序列时,大家会通过什么样的方式

2021-04-22 19:13:25 811

原创 根据某一列的进行去重的小工具----duplicated.exe

在处理表达谱数据的时候,你是否遇到过在设置行名的时候,出现行名不同重复的问题,那时候的你会怎么处理呢?当年的我,花费了很大的力气,最后才解决这个问题,由刚开始的用excel一个一个手动删除,到现在用脚本删除,这个过程用了很长时间。现在为了让初学者更容易解决这个问题,不再走小编当前走过的艰难老路,小编将该部分功能进行封装,并做了可视化的界面,方便大家更好的理解和使用!首先,该软件是用python包装,大家需要在使用前安装python3.8及以上的版本,安装完成后,退出杀毒软件,解压压缩包。压缩包下有这么几

2021-04-20 19:48:37 605 5

原创 TMB计算的小工具-calculate_TMB.exe

TMB即肿瘤突变负荷,在很多文章中均又涉猎。什么是TMB呢?普遍认为单位长度内检测到的基因突变个数。例如某检测覆盖基因1MB长度,在1MB长度内检测到了有20个突变,那么就属于肿瘤突变负荷高(TMB—H)。不同检测所覆盖的基因长度和个数稍有差异。选择的基因大概是随机分布在23对染色体上。如何去计算呢?生信菜鸟团中写的已经很详细,详细的可以看一下链接,这里不过多介绍。http://www.bio-info-trainee.com/2513.html如果大家会使用代码,可以看上面的链接,自己学着计算TM

2021-04-09 11:44:02 418 4

原创 一个基于长数据转化为宽数据的小软件---data_tran.exe

长宽矩阵在转化的过程中有很多种方式,我最喜欢就是用R或者python去进行转化,当然也可以进行手动转化首先,我们看一下数据的形式,以及我们想要转化的形式以A列作为行,B列作为列,E列的值填充在这个数据中,转化的新的数据如下所示如果这里大家使用python和R去做的话,可自动跳过1、下载和安装python,要求版本在3.8以上,详细安装的步骤在这里就不介绍了,百度一搜都是啦2、获取我们的压缩包,在我们的压缩包下面有这些文件,如下所示,这里我准备了一个测试数据,precent_data.csv在路

2021-03-25 18:03:33 120 4

原创 cytoscape插件centiscape的使用

centiscape插件是一个可以用于计算一次性计算多个中心值的工具,类似于network analysis等。通过node的拓扑属性和生物学属性寻找最显著的差异基因,但是它是基于无向型网络,才能够使用和计算的。下面我们通过简单的实例来介绍该插件的使用!1、未安装该插件,先安装该插件,安装步骤如下:如果安装好了,就会有centiscape这个选项,如果没有安装,则选择app manager这个选项,找到该插件的名称,直接进行安装就好了,剩下的就是等待安装成功!2、安装完成后,需要准备数据,数据的形式

2021-03-02 11:37:55 842

原创 sangerbox平台使用(六)富集分析

富集分析作为当前被生信分析的常规手段已经被用的越来越多。目前能够进行富集分析的方式有很多,如DAVID在线工具,R语言的clusterProfiler包等。但是对于DAVID在线工具来说,界面很友好,操作简单,缺点也很明显,更新较慢,背景数据集更新不够,导致富集分析的结果不是很准确。而R语言的clusterProfiler包恰好相反,操作复杂,还需要学习编程很麻烦,但是他是直接链接到官网上的背景数据集,不存在更新速度不够快的问题。sangerbox开发了一个基于R语言的clusterProfiler包做富

2021-02-25 21:15:35 426

原创 sangerbox平台使用(五)venn图的绘制

首先,我们需要进入工具链接

2021-02-25 20:41:17 172

原创 cytoscape插件bingo使用

首先需要安装该插件,选择apps—app manager,安装binGO插件打开bingo插件,如下所示首先需要了解如何输入基因,有两种方式,一种是基于gene-gene互作网络,选择网络中的点进行富集分析。另一种是根据单独输入基因的名称来做的富集分析分析的结果展示方式体现了功能条目之间的相互层级关系,教程也是很多,https://www.jianshu.com/p/55570262ae3fhttp://www.360doc.com/content/18/0413/13/42030643

2021-02-24 20:50:00 610

原创 一个带有误差棒的另一个箱图

今天遇到一个图,需要有R绘制一个展示平均数,误差的的点图,并进行数据统计,如下图所示数据格式如下data行为基因,列为样本分组信息如下#先计算pgrou1=as.character(unique(grou$group))[1]grou2=as.character(unique(grou$group))[2]grou1grou2#数据的列数data_col_num=ncol(data)data_col_num#样本的名称sample1=as.character(grou[w

2021-02-04 20:50:22 212 1

原创 R语言绘制不一样的条形图

绘制条形图的方法有很多,这里介绍如果用R语言绘制一个不一样的条形图准备数据,这里为了方便,我们使用已经存在于gcookbook包中的一个数据集首先需要调用该包,如果该包不存在,可以使用下面的方式安装该包install.packages('gcookbook')#调用该包library(gcookbook) #查看该数据cabbage_exp绘制基本的条形图ggplot(cabbage_exp,aes(x=Date, y=Weight, fill=Cultivar))+ geom_b

2021-01-26 21:08:20 354

原创 cytocape绘图(三)

最近很多人都在问一些问题,这里我写一篇文章用于统一解释一下这些问题:1、在绘制网络图的过程中,如果需要绘制三者之间的关系怎么办?三者的关系也可以看成是两两关系的组合,如A-B-C这样的关系可以拆解成A-B和B-C的关系,然后把这两个文件放在一个表格中,即可。2、在绘图的过程中,外圈绘制不圆,怎么让他手动调整中变圆?首先,我们可以打开cytoscape,按照前面的步骤,导入数据,修改点的属性选择annotation点击空白的地方我们在空白的地方画出一个圈然后将这些点一个一个移动到边缘处删掉

2021-01-21 21:17:57 300 4

原创 R语言数据降维

今天是2020年的最后一天,这一年多灾多难,让我们唏嘘不已。不论2020如何,生活仍要继续,希望即将到来的2021年,可以‘牛’转乾坤。这也是2020年的最后一篇博客了,在这里给大家介绍一下。目前R语言的几种降维方式。首先需要配置数据data<-matrix(rnorm(3000),ncol=6)colnames(data)=paste0('gene',1:6)rownames(data)=c(paste0(rep('C',nrow(data)/2),1:(nrow(data)/2)),

2020-12-31 13:47:19 920

原创 R语言矩阵的转化

在使用R语言的过程中,我们会遇到很多问题,比如说长宽矩阵的转化,不能每一次都是手动处理,这样也很麻烦,实现长宽矩阵的转化的方式很多,我们只需要掌握其中一对就好。1、宽变长这里我随意设置一个矩阵,作为测试数据#测试数据的生成,10X10data=matrix(1:100,nrow=10)colnames(data)=paste0('sample',1:10)data=data.frame(gene_name=paste0('gene',1:10), data...

2020-12-25 13:24:08 2118

原创 linux安装R包的安装

首先在linux系统下,需要安装好R语言,由于依赖环境较多,一般会通过第三方软件库进行安装,比如说miniconda等R包分以下几种:镜像包:一般安装方式为:install.packages(''),选择合适的镜像进行安装bioconductor包:一般安装方式为github包,一般安装方式为:1、确定我们需要安装R包属于哪种?可以先默认用镜像安装的方式,如果出现报错,如下:说明limma包不是镜像包,这时候,可以进入bioconductor官网https://bioconductor.or

2020-12-25 13:23:32 1287

原创 sangerbox平台使用(四)气泡图的绘制

前面介绍了sangerbox平台非常强大,能够做的功能非常多,本次我介绍的是使用sangerbox绘制气泡图官方链接:http://sangerbox.com/AllTools?tool_id=9697991界面非常简洁,工具说明对数据的格式写的非常清楚,这里我就再重复一次了,作者在做这个工具的时候设计非常人性化,照顾到很多不会写代码的人,让很多人在不用学编程的情况下就可以绘制一个好看的气泡图了。这里我简单介绍一下,气泡图应用的场景有哪些?1、富集分析结果的展示:如点的大小展示富集到这个通路上的基

2020-12-11 21:51:40 536 1

原创 sangerbox平台使用(三)绘制火山图

目前绘制火山图有很多工具,我们最常用的就是R语言,本次想向大家介绍的是一个在线工具直接绘制火山图—sangerbox官方链接为:http://sangerbox.com/AllTools?tool_id=9699135打开后界面如下:首先,需要准备数据,准备的数据为差异分析的结果如何使用呢?直接复制粘贴差异分析的数据,第一列为基因,第二列为logFC,第三列为显著性p值(或者是FDR),如果想显示部分基因在火山图上,即在需要显示的基因列表中输入要显示的基因名,一行写一个即可选择合适的参数,这个可

2020-12-11 21:25:56 850

原创 sangerbox平台使用(二)差异分析

目前,网上有很多都是在写如何使用R语言做差异分析,当然也有一堆人在安装R包的过程中出现问题,甚至也有人在说R语言在做差异分析的过程中,究竟什么样的数据用什么包来做呢?怎么做呢?有什么可以让我鼠标点点的方式直接使用的吗?这里给大家推荐一个小工具,sangerbox该平台提供了两个小工具分别适用于目前做芯片数据和高通量测序数据进行差异分析。首先,我们需要了解一下这两个工具分别适用于哪些数据呢?1、limma差异分析,http://sangerbox.com/AllTools?tool_id=9698737

2020-12-11 21:25:21 1417

原创 sangerbox平台使用(一)文献的查看和下载

最近在查找文献总是遇到很多的问题,如文献无法下载、感兴趣的文章需要单独去查影响因子等等因素。这里给大家推荐一个非常好用在线工具—sangerbox官网链接为:http://sangerbox.com/Search?chk1=&chk2=&chk3=&chk4=&page=1&chk5=界面如下:可以输入相应的关键字,界面和NCBI的查找文献的界面很像。如输入cancer可以从搜索的结果中看到该文章发表的时间,杂志,影响因子等等信息。至于下载界面更是友好,选

2020-12-11 17:34:21 431

原创 ComplexHeatmap包绘制热图(二)

前面我介绍了如何利用ComplexHeatmap包绘制简单的热图,现在我们绘制一个稍微复杂一些的热图首先还是配置数据data=matrix(rnorm(100),nrow=10)colnames(data)=paste0('sample',1:10)rownames(data)=paste0('gene',1:10)head(data)准备另外一个数据anno_row=as.matrix(1:10)rownames(anno_row)=paste0('gene',1:10)colname

2020-12-09 20:27:01 2271 6

原创 ComplexHeatmap绘制热图(一)

讲起热图,大家都会比较熟悉,绘制热图方式比较多,这里介绍的是ComplexHeatmap包绘制热图,首先配置数据,这里的自动生成一个10X10的矩阵data=matrix(rnorm(100),nrow=10)colnames(data)=paste0('sample',1:10)rownames(data)=paste0('gene',1:10)head(data)加载R包library(ComplexHeatmap)Heatmap(data, col=c('blue','

2020-12-09 19:39:11 1766 2

原创 spell_picture3.1版本windows上手动拼图的软件的升级

在介绍本文之前,我们需要了解的是spell_picture3.1版本相比较之前的spell_picture3版本优化了哪些功能呢?以下是spell_picture3版本的界面而spell_picture3.1版本的界面为从样本中可以清楚地看出来,3.1版本相比较3的版本多个一个图片间隙的参数输入,以及字体格式的选择。·一、安装过程(如果之前安装python3.8以上版本,该步可以省略)压缩包下有一个python的exe软件,可以直接双击安装,如果有问题,可以查看之前的文档,或者百度如何安装二、安

2020-11-26 15:37:54 240 2

原创 spell_picture第三版终于摆脱了命令行的操作

相比较前两版,在实现拼接图片的功能的同时,增加了一个可视化的界面,前面的步骤可以参考链接https://blog.csdn.net/weixin_43949246/article/details/109783239https://blog.csdn.net/weixin_43949246/article/details/109736601分别对应的第一版了第二版打开压缩包选择spell_picture3文件夹该文件夹下我们可以看到有一个spell_picture3.exe的软件,直接双击就可以

2020-11-23 21:54:08 251 1

原创 如何绘制venn图

1、https://bioinfogp.cnb.csic.es/tools/venny/index.htmllist1,2,3,4就是数据集的名称,可以直接输入基因的名称,该网站的优点是可以直接输入各个交集的基因,从图中直接点就可以了。2、3、https://bioinfogp.cnb.csic.es/tools/venny/index.html4、https://bioinfogp.cnb.csic.es/tools/venny/index.html5、http://sangerbox.com

2020-11-19 23:37:05 2070

原创 spell_picture二次升级版

相比较于第一版: 修改的内容为字体颜色修改了为白色,图片和图片之间存在了空隙,第一版的图片要求图片为正方形,现在就不需要了,可以看一下怎么使用首先一样下载安装包, 安装包可以私信告诉我哈。压缩后的文件里面总共有这几个文件首先安装python,双击安装就好了,需要注意的是,将工作环境添加进去,如果没有也没事,可以后期通过环境变量添加然后复制SimHei.ttf文件粘贴到C:\Windows\Fonts文件夹下。最后就是使用了,跟前面不一样的是这里没有-r的参数,多了一个-c的参数,之前的绘制是以行来

2020-11-18 20:28:47 338 2

原创 windows下一个好用直接拼接图片的软件spell_picture

为了减轻得到大量的荧光图片时拼图的烦恼,在这里包装了一个专门用于拼接图片的软件spell_picture。 在下载软件之前需要先安装python环境,默认是3.8以上版本就可以了安装过程在这里不展示了,直接默认就好了。 下载安装包之后会出现这几个文件 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201117100524382.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_..

2020-11-17 10:26:16 996 1

原创 windows共享linux的某一文件夹

linux的系统为centos71、安装samba软件yum -y install samba samba-client修改配置文件vim /etc/samba/smb.conf主要是在文件的最后增加共享文件夹[shares]path = /data/sharessecurity = sharebrowseable = yespublic = yeswriteable = yesguest ok = yes详细的信息可以查看https://blog.csdn.net/weix

2020-11-12 10:47:55 97

原创 miniconda安装,及channels配置,安装其他软件

在使用linux中,经常会遇到安装软件,配置环境的问题,有一种偷懒的方式,就是使用第三库进行安装,就是类似于在windows下使用软件管家安装软件,这样做最大的便利在于不需要去配置很多的依赖环境1、下载minicondawget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh**2、安装**bash Miniconda3-latest-Linux-x86_64.sh回车,yes,写上相应的路径(注

2020-11-12 10:15:52 752

原创 气泡图(一)

这里我们绘制的是一个简单的气泡图,其实也就是一个散点图,如下所示为了更加容易讲述,自动生成矩阵dat1<-matrix(rnorm(20),nrow=4)colnames(dat1)=paste0('sample',1:5)rownames(dat1)=paste0('gene',1:4)#查看dat1dat1library(ggplot2)library(data.table)dat2=melt(data = dat1,id.vars=rownames(dat1))col

2020-09-01 21:08:00 1050

原创 如何使用ggplot2绘制左右分布的柱状图

#调用ggplot2包library(ggplot2)#读取数据,数据共两列data1<-read.table('1.txt',sep='\t',header = T)head(data1)#增加一组分组,将logFC>0设置为A组,小于0设置为B组,当然这里也可以直接读取一个三列的数据data1$group<-ifelse(data1$logFC>0,'A','B')head(data1)#初步绘图ggplot(data1, aes(pathway, lo

2020-07-03 18:47:24 2384

原创 pathview包绘制富集的kegg图

1、首先我们安装pathview包if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("pathview")2、调用pathview包library("pathview")3、准备文件rt=read.table("input.txt",sep="\t",header=T,check.names=F)#查看前6行head(rt)

2020-07-03 18:01:01 671

原创 R语言之数据统计

我们常常会遇到一个问题,比如说给我们一个表格,需要统计满足某一条件的个数,一、介绍一个table函数首先看一下数据data<-read.table('1.txt',sep='\t',header=T,row.names=1)head(data)table(data$names1)table(data$names1,data$names2)二、统计矩阵中每一列中某一个数值的...

2020-04-11 20:46:33 8122

duplicated.zip

根据某一列对数据进行去重

2021-04-20

extract_seq.zip

根据基因id从fasta文件中提取序列信息的小工具-extract_seq.exe

2021-04-21

6 用 ggplot2 进行数据可视化.pdf

R语言可视化之ggplot2,绘制好看的柱形图、散点(气泡图,火山图)、箱线图等等。每一个都需要使用特定的函数

2019-06-18

convert_picture.zip

实现图片之间互换的小工具convert_picture.exe,如tiff格式的图片转化为png

2021-04-29

calculate_TMB.zip

通过maf文件计算TMB得分

2021-04-10

spell_picture3.1

自动拼接图片的软件,可以添加文本,间隔等等信息,设置图片的行数和列数,不会压缩图片本身,是一个自动化拼接图片的软件,该软件是用python进行包装使用的,在使用过程中需要配置python的环境,默认使用的是python3.8以上的版本,使用链接,见文档,https://blog.csdn.net/weixin_43949246/article/details/110188806

2020-12-11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除