自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 python数据处理学习记录

本文学习按照lightgbm的simple example进行。

2023-11-23 11:58:52 40

原创 R语言 日期处理的常见问题

注意,对时间格式处理时,最好重新ymd或ymd_hms或as.Date(tz=“”)。否则有时会有默认时区不一致,导致时间出错。如果一列中有多种格式的日期,例如"2023-11-21 13:00:23"和"2023-11-21",很容易报错。

2023-11-21 22:19:08 123 1

原创 数据清理项目feedback记录

对dt_omics中每个样本,针对唯一识别码(样本编号)、患者ID、样本日期,从而匹配日期最近的病理诊断信息。如果病理诊断为单一诊断,则直接返回该位置为1,其他位置均为0的向量。唯一识别码定义不清。导致出现冗余的清理代码。20231105 反思组学数据中,病理类型清理问题。不应该直接去清理表格,再将清理好的表格进行合并。如果病理诊断为NOSURE。应该针对每位患者去清理,减少可能的情况。避免了很多复杂的tag和清理规则。

2023-11-05 20:26:19 50 1

原创 好用的r包

画interaction and rcs。

2023-04-27 17:15:57 65

原创 ggplot2使用技巧

ggplot2部分技巧

2022-11-18 16:37:06 409

原创 R常用函数(data.table、并行函数)使用技巧

lapply 可自外部传递参数lapply(DT[-1], quantile, probs = 1:3/4)#probs可在function后面作为参数传递do.call(rbind,lapply(range_split,`length<-`,max(lengths(range_split))))#通过传递参数进行补齐mapply和Map可传递多个参数mapply(function(x, i) paste(i, x), x, names(x))# a b .

2022-01-12 09:38:54 929

原创 R 正则 正向预查/反向预查

写在最前面:本文主要为了解决在单正则式中表示非/不包含某字符串的问题。需要用到perl=T当然可以使用grep+!grep联合表示,but我懒。一、引入及概念#eg.> grepl("[^脑].*室","室")[1] FALSE原因:[ ^脑]表示非脑,但需要消耗字符串中的字符,即需要一个字符位于室前面,来匹配[ ^脑]。解决方法:使用不消耗字符串中字符的正向预查/反向预查,即(?=PATTERN)和(?!PATTERN)二、正向向后预查eg. grepl("(?=PATTERN

2021-12-02 21:59:34 548

原创 linux 正则 tips记录仪

1、用正则取子串原文链接:https://www.cnblogs.com/jmliao/p/11808592.html通过试验,可以通过grep、sed两种方式实现。假设需要提取libgcc-4.8.5-4.h5.x86_64.rpm中的版本号。Topgrepecho “libgcc-4.8.5-4.h5.x86_64.rpm” | grep -Eo “[0-9]+.[0-9]+.*x86_64”grep的-o选项,可以只打印匹配的部分,否则会打印整行。Topsedecho “libgc

2021-04-27 09:55:07 64

原创 从github上装R包

先安装devtools。直接装的话非常慢,所以用其他源来下~options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")install.packages("devtools")如果直接用devtools的包的install_github经常是装不上去的。最好是把github的包手动下下来,阔以直接github网页上面下,在右上角的位置~ 或者用git clone http://然后setwd()到下载的路径,再devtools:install(’’

2021-01-12 15:28:00 592

原创 【R包安装报错系列】ubantu下安装R包报编译失败

今天在安装rtracklayer包,一直报编译失败的错The downloaded source packages are in ‘/tmp/RtmpkZpkOC/downloaded_packages’Installation path not writeable, unable to update packages: backports, BH, broom, caTools, cli, codetools, colorspace, cowplot, cpp11, data.ta

2021-01-12 11:22:17 2576 2

原创 【自用】TCGA相关链接

比较全面的教程:戳这里TCGA表达数据下载一 官方下载指南TCGA表达数据下载二 使用官方工具下载TCGA表达数据下载三 临床数据下载TCGA表达数据下载四 数据整理示例

2021-01-08 19:39:02 80

原创 【自用存链接】RNA Seq软件

cutadapt:含流程,含各种:https://www.cnblogs.com/xudongliang/p/6404958.htmlHISAT2和STAR:当注释文件非常详细时,建议使用STAR或HIset2HISAT2能够处理SNP信息,可以同时比对DNA和RNA关于HISAT2的使用(1)HISAT2 index的构建可以输入的信息包括:①SNP信息dbSNP common文件②可变剪切信息GTF/GFF文件③参考基因组序列Genome FASTA文件三种信息的下载方法:

2020-12-28 15:38:59 228

原创 【自用存学习链接】R语言正则表达式

1、非常全,包括stringr包和基本函数,以及大部分的正则表达式:https://www.jianshu.com/p/b3f70d96455f

2020-12-25 09:37:12 91

原创 预测adapter软件:minion的安装详解 小白专用

官网:https://www.ebi.ac.uk/research/enright/software/kraken官网使用手册:http://wwwdev.ebi.ac.uk/enright-dev/kraken/reaper/src/reaper-latest/doc/minion.html#test-adapter安装:wget http://wwwdev.ebi.ac.uk/enright-dev/kraken/reaper/src/reaper-latest.tgztar -zxv -f r

2020-12-24 17:17:04 1422

原创 ubuntu装fastx_toolkit 步骤

代码资料来源:1、fastx_toolkit安装指南:http://hannonlab.cshl.edu/fastx_toolkit/install_ubuntu.txt2、fastx_toolkit安装及报错:https://www.jianshu.com/p/75cc8440e8cb3、linux下gcc、g++不同版本的切换:https://www.jianshu.com/p/f66eed3a3a25fastx_toolkit安装步骤:1、安装libgtextutils2、安装fastx_

2020-12-23 15:22:45 1418

原创 linux下conda报Solving environment: failed with initial frozen solve. Retrying with flexible solve.

报错如下:Collecting package metadata (current_repodata.json): doneSolving environment: failed with initial frozen solve. Retrying with flexible solve.Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.

2020-12-21 10:46:56 3101

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除