- 博客(21)
- 收藏
- 关注
原创 awk 操作两个文件内容之匹配替换
先上代码awk '(NR==FNR){a[$1]=$2;next} ($2 in a){$5=a[$2];print $0}' file1 file2以上代码的意思是处理第一个文件时先将文件1的第一列和第二列存在数组里,处理第二个文件时将第五列替换成数组中的相对应的值...
2021-12-14 20:38:57 1426
原创 awk 的坑|产生的每行最后没有换行符
本来想靠awk 产生一个简短的test文件,结果出bug出的好难受,发现问题出在我生成的test文件每一行末尾没有换行符上awk '{print $1,$2,$3}' raw.file > test.file加上换行符就好了awk '{print $1,$2,$3,'\n'}' raw.file > test.file...
2021-12-14 20:31:05 1738
原创 R 语言ggplot 换颜色-发文章用的sci 色卡
那当然就是ggsci 包啦包含多种选择,先上图:Nature Publishing GroupJournal of Clinical Oncology还有很多选择,只要在ggplot2 基础上加一行代码即可搞定最后放一个教程链接https://nanx.me/ggsci/articles/ggsci.html再外加一些其他的包和好看的palette.https://www.r-graph-gallery.com/ggplot2-color.html...
2021-12-09 18:38:38 1057
原创 r 语言 得到list的长度,length 和lengths
length(x)Get or set the length of vectors (including lists) and factors, and of any other R object for which a method has been defined.lengths(x)Get the length of each element of a list or atomic vector (is.atomic) as an integer or numeric vector.举
2021-12-08 22:00:29 1751
原创 r 语言 用separate 将一列分割成两列的坑 Expected 2 pieces. Additional pieces discarded
当你要分割的列用的是“.”来分隔时,在separate函数中sep要设置成"\."数据:separate(ridge_pred[1:5,],col=Resample,into = c("fold","repeat"),sep = "\\.")分割结果:
2021-11-14 21:57:25 2228
原创 Configure: error: C preprocessor “/lib/cpp“ fails sanity check
Configure: error: C preprocessor “/lib/cpp” fails sanity checkmac 安装软件时遇到问题gcc 和 cpp fails sanity check只要把 CC 换成 clang, CXX 换成clang++export CC=clangexport CXX=clang++也可以直接cofigure./configure CC=clang CXX=clang++po 一下各个参数CC=‘clang’CCDEPMODE=‘dep
2021-07-11 19:29:11 1088
原创 anaconda安装R 包和直接安装的体会
之前直接用Rstudio 安装R包就没有成功过, 不过有文章说如果用conda管理的话最好就用conda 来安装R包,只要加上前缀r- , 如果是bioconductor 的包就是 bioconductor- , 安装命令如下#先激活r的环境conda activate r#安装r包conda install r-package_name但是很多包在conda中并没有,需要通过devtools 从github上来安装,看到一个先安装rstudio再绑定R 的方法install the la
2021-04-06 20:06:09 2174
原创 anaconda 创建环境下rstudio 安装r包失败的问题
用Rstudio 安装R包老是失败,这次的报错是/bin/sh: x86_64-apple-darwin13.4.0-clang++: command not found解决方案:在终端输入conda install clangxx_osx-64export CONDA_BUILD_SYSROOT=$(xcrun --show-sdk-path)
2021-03-31 21:11:04 1478
原创 R 中实现PCA分析和画图--一文搞定
自用链接 :http://www.sthda.com/english/articles/31-principal-component-methods-in-r-practical-guide/112-pca-principal-component-analysis-essentials每一步都写的很详细,照着做下来就可以啦
2021-03-06 15:23:48 1993
原创 R 语言中正则表达式的不同(坑)
R 中的"\"要加一个"\" 来转义,如“\(”要变成"\\(", "\\"要变成"\\\\",总之用到"\"就要多加一个"\"
2021-02-22 16:43:16 137
出现installation of package ‘igraph’ had non-zero exit status,不妨换一种安装方式
今天下载bioconductor上的包安装又出错了,每次都不知道要咋解决,于是全部丢给conda 来安装ps.我的Rstudio是用anaconda 配置的我是自己创了一个专门用于R 的环境于是conda activate r# 我自己的环境名激活环境之后直接用conda安装包conda install bioconductor-gep2pep这里如果是bioconductor上的包只要加一个前缀 “bioconductor-”就行,如果就是一个r包可以直接加前缀“r-”exp.con
2021-02-09 22:01:34 2560
原创 auto encoder 自学
github上不错的教程(实例)https://github.com/minsuk-heo/tf2(基于tensorflow)不错的博文https://towardsdatascience.com/applied-deep-learning-part-3-autoencoders-1c083af4d798
2021-01-04 15:30:34 71
原创 R studio 快速定位代码的技巧
当我们要写很多代码的时候,回过头看之前的代码可能会有找不到的情况,在Rstudio中其实可以用一个小技巧将一个一个代码块总结起来。就是用一个注释符号# + 标题 + ------ 就可以定位啦甚至还可以折叠代码块哦点击这个小三角形就可以把这一块代码折叠起来,除了在这里显示这个你的代码标题,在代码大纲处也会显示哦今天的分享就到这里啦,欢迎关注我哦!...
2020-07-21 17:04:34 925
原创 R 语言 对两个数据框用t 检验(t test)
p_value <- sapply(1:nrow(sample1), function(x) t.test(sample1[x,], sample2[x,],alternative = 'two.sided',var.equal = FALSE)$p.value) 当样本储存在两个数据框中时,可以用for循环来做,也可以用上述代码的sapply,t.test有一些参数需要根据自己的需要做调整。...
2020-07-21 11:16:47 1920
原创 R 语言中使用filter 后行名消失问题解决
本来输入的数据框是有行名的,没想到用完filter,行名就没了。data %<>% filter(n_cells>14)看了一下文档,确实是会将行名悄悄删掉的文档也该出了解决办法,现将行名转换成列,之后再换回来。data %<>% rownames_to_column()data %<>% filter(n_cells>14)data %<>% column_to_rownames()(嘻嘻,打个广告,小红书号:42306866
2020-07-15 16:19:07 1514
转载 正态分布的魅力-正态分布的详细介绍,从历史源头来看正态分布
分享这篇巨好的文章,看完真的是感受到了数学的神奇,正态分布的魅力。https://songshuhui.net/archives/76501
2020-07-06 14:37:45 579
原创 sam/bam 文件官方详细解释(包含所有tags)
看很多博客也没找到某一些tags的解释Po 一下官方的解释文档http://samtools.github.io/hts-specs/SAMv1.pdfTags 的详细解释http://samtools.github.io/hts-specs/SAMtags.pdf
2020-06-18 14:51:36 2095
原创 pysam 读fastq文件提前结束的问题
写两条序列测试一下fg2=gzip.open('./test.fq.gz','wb')fg2.write('@'+'CL100127242L1C001R001_0/2'+'\n')fg2.write('GAAGAGAGCTGTAAGGAAAAAGGCCACAAGTAAAAGGAGAAGCTGTTTCGTGAACCTGACTTGGTGTCCGTGTTGTTCCTGTCTCCGCCAGAGCGGAGAT'+'\n')fg2.write('+\n')fg2.write('DDDDBCDCCDCDDDDB
2020-05-26 16:57:41 536 1
原创 用python将基因id转换成基因名
下载python包pyensembl,终端输入pip install pyensembl在使用pyensembl之前还要下载相关的Ensembl数据:pyensembl install --release <list of Ensembl release numbers> --species <species-name>eg.pyensembl insta...
2020-05-06 21:42:09 3775 3
原创 Mac 安装 python-igraph 亲测有效!!!
Mac 安装 python-igraph 亲测有效conda install -y -c vgauthier cairo=1.12.18conda install -y -c pkgw py2cairo# if you want it for Python 3:# conda install -y -c richlewis pycairo=1.10.0conda install -c c...
2019-12-05 16:22:19 483
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人