自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 文章修图遇到的一些问题总结

10. 如果我们要在illustrator里面快速的更换颜色,我们可以点击软件里面的取色标记(一个空心的小吸管形象),然后再点击我们想要的颜色,再点击我们想要更改的object,就可以改色成功了。9.如果有些图的x 和 y 的ticks 太长了,比如化合物1的名字很长,化合物2的名字比较短,我们可以把它分成几行,同时也可以调整行距,可以把这个行距稍微缩短一点,使得这个长的名字别那么突兀。17.如果同一个小图,比如figure1 d的两个子图拥有一样的legend,其实是完全可以合并的,不然太过冗余。

2024-08-30 16:49:45 278

原创 小tips: add pub key to GitHub

添加ssh key 在github

2023-12-13 19:02:46 137

原创 小tips: 如何画简单的correlation图并调整图距

简单的correlation图绘制r语言

2023-12-12 23:29:01 123

原创 文章系列2:Unraveling the functional dark matter through global metagenomics

文献阅读,journalclub,Unraveling the functional dark matter through global metagenomics

2023-11-22 06:20:13 431

原创 踩坑sunbeam rbt 去除host reads

sunbeam decontamination rule

2023-02-03 02:48:41 335

原创 mOTU 安装以及简单使用

motu安装和说明

2023-02-01 04:07:26 265

原创 ANCOMBC 安装以及使用

ancombc r 包安装报错记录及解决办法

2023-01-16 23:33:57 1297

原创 metaphlan3和strainphlan3运行记录

metaphlan3老版本安装+strainphlan3运行记录。

2023-01-11 23:03:08 1384

原创 小tips: bash command prompt 消失

命令行的地址名字在conda激活后消失

2023-01-10 22:20:17 114

原创 inkscape 如何给对象添加外边框

inkscape 画边框

2022-11-21 17:57:22 1231

原创 tips: r语言排列组合给定vector的特定元素

排列组合r语言简单

2022-06-28 21:25:38 347

原创 tips: r语言根据列提取某些行的小坑注意

> library(tidyverse)> a <- tibble(sample = c(1,2,3), country = c(NA, "CHN", "AUT"), age = c(21,22,23))> a[a$country=="CHN",]# A tibble: 2 × 3 sample country age <dbl> <chr> <dbl>1 NA NA NA2 2 CH.

2022-03-15 23:09:53 1296

原创 tips: manipulating dataset

> mtcars %>% count(carb) carb n1 1 72 2 103 3 34 4 105 6 16 8 1Function count, count the numbers per group we give.Function map,map:Apply a function to each element of a vector.x A list or atomic vector.mtca...

2021-12-06 23:43:30 185

原创 tips:复制的时候出现~在复制内容前后

printf "\e[?2004l"就可以解决这个。因为每次出现问题都要搜一次,所以记录在这里。

2021-10-25 22:57:23 2150

原创 nextflow nf-core download ena/ncbi fastq data

使用这个软件可以很快的获取到下载失败的sampleswget -qO- https://get.nextflow.io | bashchmod +x nextflow测试下载是否成功sudo nextflow run nf-core/fetchngs -profile test,docker然后就可以下载自己想下载的数据了。注意如果是下载的是err,会自动转化成ERX的名字。 nextflow run nf-core/fetchngs ⁠-⁠-⁠input ids.txt

2021-10-22 21:35:51 265

原创 小tips:如何获取指定列名的列?shell

我有一个文件叫filename.txttest test2 test3 name test4 a a a cat a b c c dog c 如果我只想要获取列名为name的列,WORD="name"; head -n1 filename.txt | tr "\t" "\n" | grep -n $WORD4:name输出 4:name...

2021-09-24 21:57:37 720

原创 如何在linux mint关闭全半角

搜狗输入法,老是误碰热键.改成全角.设置方式, linux mint系统, 选择高级->打开Fcitx配置界面然后选择global Config, 再然后选择Switching Full Width Character Mode, 可以选择empty或者更改成别的热键.我换了一个不常用的,这样就不会误触了....

2021-05-07 16:33:10 212

原创 初级胆汁酸和次级胆汁酸

人体内的微生物通过作用到代谢物上面影响宿主的稳态. 所以在微生物研究中, 代谢研究非常的重要. 在target metabolomics里通常会测SCFA和Bile acids.因为对bile acid的各种初级以及次级有诸多疑惑, 所以这里查阅资料的总结.最开始还是从wiki入手, 然后再有初步了解之后再去看paper里面说的.0. 什么是bile salts大量的胆汁酸在肝脏合成, 胆汁酸和牛磺酸, 甘氨酸通常共轭结合, 他们叫做bile salts.1.什么是primar...

2021-05-07 01:28:44 9642

原创 根据列名提取指定列 shell awk

例子文件colname.txtenzyme sample1 sample2 sample3 sample4 sample51 2 2 3 4 52 2 4 6 8 83 4 7 8 9 104 5 2 5 9 0只想要提取sample1和sample5还有enzyme的数据从网上搜到的方法, 首先建立一个awk的脚本 ...

2021-04-08 20:56:04 4576

原创 如何解决报错信息:Error in UseMethod(“filter_”) 在使用dplyr包的filter() 时候

报错信息如下:Error in UseMethod("filter_") : no applicable method for 'filter_' applied to an object of class "character"Calls: %>% ... freduce -> <Anonymous> -> filter -> filter.default -> filter_In addition: Warning message:`fi.

2021-03-10 18:09:59 17689

原创 read_delim 报错解决 “Warning: 754 parsing failures.”

报错信息如下:Parsed with column specification:cols( ECs = col_character(), Combine_IDs = col_character(), compoundIDs = col_logical())Warning: 754 parsing failures. row col expected ...

2021-03-06 01:58:31 719 1

原创 graphlan/iTOL画进化树记录

最近遇到一个问题,需要将进化树展示出来,并对特定物种进行标记。我的数据是来自于人类的gut microbiome数据,分析流程是metaphlan3的分析流程,基于此输出,以及几天的调研,我下面总结了自己如何一步步画出进化树的以供参考。metaphlan3 输入文件我有一个来自于metaphlan3的输出文件,这里使用来自metaphlan3官网的例子文件wget https://github.com/biobakery/biobakery/raw/master/demos/bio...

2021-03-04 07:42:46 3309

原创 如何使用 PRROC 画 ROC 曲线

1. 什么是ROC 曲线?1.1 曲线的横纵轴sensitivity,recall,hit rate, ortrue positive rate(TPR)TPR = TP/P = TP/(TP + FN)fall-outorfalse positive rate(FPR)FPR = FP/N= FP/(FP + TN)1.2 ROC曲线:wiki在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,...

2021-02-19 23:59:34 672

原创 统计学小知识-什么是qqplot

最近读文章遇到qqplot的问题,看了几个视频讲解,大致有了个了解首先我们需要了解什么是 quantile :从这个视频里有个大概了解:https://www.youtube.com/watch?v=IFKQLDmRK0Yquantile – median – it splits the data into equal sized groups. 50% quantile如果我们将数据分为4个大小相等的组,则25%的分位数表示25%的数据点小于它。Quantile 就是把样本区分成.

2020-11-18 19:05:36 6284

原创 R语言 去掉NA求均值

数据里面有很多NA,去掉NA再对每列求均值怎么求呢?这里用到的是dyplr包a <- data.frame(a = c(1,2,NA,3),b = c(1,3,4,5),d=c(NA,1,2,3))a %>% summarise(mean_mpg = mean(a, na.rm=T),mean_b = mean(b, na.rm = T), mean_d = mean(d, na.rm = T))> a a b d1 1 1 NA2 2 3...

2020-07-31 21:05:09 9130

原创 好用的网站来一波

同事推荐的看机器学习的帖子的网站https://towardsdatascience.com/ai-in-industry-how-a-maintenance-routine-ruined-my-machine-learning-model-9b45acc69f83caret cheatsheethttps://rstudio.com/resources/cheatsheets/搜索caret就能找到了好用的PPT网站slidsgo 里面的模板都是免费的非常好...

2020-07-31 17:26:45 668

原创 installation of package ‘blob’ had non-zero exit status

今天想要安装tidyverse,但是遇到这个问题install.packages("tidyverse", dependencies = TRUE )Warning in install.packages : installation of package ‘blob’ had non-zero exit status看来是这个blob包有问题,install.packages("blob")得到了相同的报错ERROR: failed to lock direct.

2020-07-31 17:19:51 14024 1

原创 统计学视频学习笔记#28

同事推荐给我的视频,越看的多很多细节就未必清楚了,除了自己做的笔记,我想自己有时间还是在这里记录和分享下。这个人讲的入门课程非常的简单,尤其对于我这种统计小白来说也很好理解,如果大家有时间也可以去看看,名字是:Statistics Course for Beginners: Introduction to Statistics | MarinStatsLectures以下是笔记:#28 这节课主要讲的是统计假设检验中遇到的errostype i error : 就是拒绝(reject)了原.

2020-07-12 01:55:07 202

原创 使用inkscape截图

这次记录下,如何使用inkscape截图首先把它拽进画布里面:选择左边工具栏里的方框 (箭头所示)用方框圈住想要截图的部分可以通过选择右侧的capacity 看清楚截图的部分到底是哪部分按住shift键,同时选中原图和圈起来的这个方框里的图右键,选择set clip,截图就完成啦!...

2020-07-10 17:20:36 1656

原创 R包ggpubr 带error bar的柱状图怎么画

有个神奇的画图包 叫ggpubr也是我经常用来画barplot;boxplot的,可以自动计算统计量,非常简洁好用,而且默认图形也非常好看拿数据集合ToothGrowth作为例子数据 :# install packagesinstall.packages("ggpubr")# load library and datasetlibrary(ggpubr)data(ToothGrowth)先画一个最简单的barplotggbarplot(ToothGrowth,...

2020-07-07 17:49:41 4968 4

原创 deeparg 安装

真是一波三折,经过多次发邮件更新,这个软件的安装终于可以流畅的进行下去了需要注意的是软件用的2.7的版本,所以一个单独的python环境是需要的,可以用docker virtualenv conda这里是安装conda的环境Install using conda environmentCreate a virtual environment with conda: 新建conda环境conda create -n deeparg_env python=2.7.18source a..

2020-06-25 18:59:37 1413 5

原创 R语言如何对每一行求和

最近遇到的小问题,需要对每一行的特定列求和文件实例df <- data.table(sample = c("test1","test2","test3"), value1 = c(1,2,3),value2 = c(2,4,5),value3 = c(2,1,7), value4 = c(4,2,1), group = c("Disease","Healthy","Disease"))推荐一个集成R包 叫tidyverse里面集成了非常多有用的R包 非常便利...

2020-06-16 22:40:07 34176

原创 用awk求和某一列+bash循环+下载gg13数据库以及建立索引

做课题遇到的小问题,随手记录1. 下载greengenes13_5数据库 + 用bowtie2建立索引+ 统计长度greengene是有名的16S数据库,里面有多个版本,此次我使用的是13_5的版本https://greengenes.secondgenome.com/?prefix=downloads/greengenes_database/链接网址选择想要下载的版本,选择fasta.gz右击地址复制下载fasta序列 后面我需要比对 所以下载这个wget htt...

2020-06-10 17:54:59 352

原创 文章系列-一篇很老的nature文章

今天偶然听同事讲到微生物领域的大牛我们比较关注临床应用和微生物的关系,下面这篇文章就是鼎鼎有名的微生物和obese的研究成果Microbial Ecology: Human Gut Microbes Associated With Obesity这是篇2006年的nature这篇nature是微生物界的大佬Jeffrey I Gordon发的。他实验室的很多人后面都成为这个领域的大牛、小牛了。https://gordonlab.wustl.edu/真的是大牛,这个CNS文章量我感...

2020-06-05 18:15:22 453

原创 关于文章配色好用的网站和R包

有时候发现自己做的图很低级,今天请教同事才发现,我可以用这个方式来定义自己的图 https://cran.r-project.org/web/packages/ggsci/vignettes/ggsci.html对应不同的杂志,他都有对应的Function推荐这个网站列出了很多popular的图供参考:https://www.designwizard.com/blog/design-trends/colour-combination...

2020-06-05 01:46:36 177

原创 带有“/”的sed替换怎么做 - 随手记录系列

经常会遇到地址改变了 但是脚本其他地方都不变的情况这时候使用sed替换再方便不过了sed 's;/Volumes/documents/;/media/documents/;' test.sh > analysis_1.sh 这里是使用;作为定界符,非常方便!附上普通sed s的替换查找小例子在文件每一行前面插入固定的字符sed 's/^/hello/' test.sh全局替换某个字符串sed 's/hello/hi/g' test_1.sh替换每行的第二个..

2020-06-03 16:23:27 385

原创 画多边形图 R语言 polygon ggplot2

最近涉及到画多边形的diversity的图建立好的坐标系set.seed(1234)df <- data.frame(x = rnorm(20), y = rnorm(20), group = c(rep("Disease",12),rep("Healthy",8)))数据举例:# 计算凸点chull 以便于连线find_hull <- function(df) df[chull(df$x, df$y),]hulls <- ddply(df, "grou..

2020-05-31 06:15:32 5205

原创 ddply 分组求均值 r

方法一:建立一个矩阵dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F"), size = 29, replace = TRUE), age = runif(n = 29, min = 18, max = 54))利用plyr里的ddply可以分组求均值和sumddply(dfx, .(group, sex), sum...

2020-05-31 05:55:11 3959

原创 啥是“quoting reference XXX” 递交申请材料时

当我们申请一些海外公开职位(PhD, posdoc,...) 的时候对方有时会要求CV, motivation letter, transcripts... should be sent as a single PDFquoting reference XXXuntil May 23, 2020 to xxx email.这里的quoting reference常常令我疑惑,...

2020-04-30 17:10:05 1363

原创 R语言 rscript 传参数

Rscript 传参数,非常简单的方法例子如下 :args = commandArgs(trailingOnly=TRUE)if (length(args)!=6) { stop("Rscript 1_compare_results.R file1 file2 outdir outname file3 file4")} else if (length(args)==6) {...

2020-04-28 18:46:23 2905

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除