自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 MIMICIV2.0版本Concepts自动生成

近期MIMICIV数据库更新了2.0版本,这篇是自动生成Concepts的详细教程。

2022-07-19 11:33:44 2102 17

原创 在R语言中操作PostgreSQL

我习惯用R语言分析数据、作图,用postgreSQL管理数据,提取数据库。R语言可以直接调用postgreSQL整理好的数据,速度也很快,操作很方便。这一篇记录一些常用操作。系统和软件:WIN 11PostgreSQL 13 + PgAdminR 4.1.3 + Rstudio1. 安装包与读取数据这里用到的包是RPostgreSQL,需要预先安装一下。#加载包library(RPostgreSQL)#建立连接con <- dbConnect(RPostgres::Postgr

2022-05-27 15:22:25 1464 1

原创 用R语言画ROC曲线及精确召回曲线(Precision-Recall Curve)

R语言绘制ROC曲线和PR曲线

2022-05-24 21:25:02 5024 8

原创 R使用XGBoost并配置GPU 附:LightGBM

在R中使用XGBoost时如何进行GPU加速?Xgboost下载安装及GPU配置记录

2022-04-29 14:57:21 2603

原创 R:读取大的TXT文件

在做生信的时候经常要读取很大的基因表达矩阵,通常下载的时候是txt文件,文件巨大,读取就很慢。下面比较三种方法的读取速度:read.tables <- Sys.time()temp <- read.table(file = 'D:/symbol.txt', sep = '\t', header <- T, check.names = F)e <- Sys.time()print(e - s)#Time difference of 2.053548 minsD

2021-09-11 20:23:41 5774

原创 GBD数据库相关文献中的EAPC怎么算?

发现近年来好多人利用GBD数据库发了很多文章。GBD数据库(http://ghdx.healthdata.org/gbdresults-tool)中关于疾病的发生率、死亡率、DALY等数据都是现成的,所以主要的工作量包括:下载数据并整理成表格:用R比较方便,用Excel也行;数据的可视化(画图):用R的ggplot包比较方便,推荐参考书籍:Winston Chang. R数据可视化手册(异步图书)人民邮电出版社相关变化趋势的计算:常用方法的是Estimated annual percentage

2021-07-10 17:48:56 7124 10

原创 利用GBD数据库做未来疾病负担预测

最近看到一篇文献,利用GBD数据库中的数据对疾病负担的发展趋势进行预测。觉得很有趣,就抽空用R语言复盘了一下里面关键的方法。参考文献:Changing trends in the disease burden of esophageal cancer in China from 1990 to 2017 and its predicted level in 25 yearsDOI: 10.1002/cam4.37751. 相关R包的安装主要用到的R包有3个,一个一个讲:1.1 Nordpred

2021-07-10 17:13:20 28588 187

原创 整理论文基线数据的function

在做临床论文,整理基线数据的时候,遇到很多分类变量,比如说性别,种族,合并症,用药等等,一个一个整理比较麻烦,就写了一个function,可以比较方便地整理数据。原始数据的样式:这个function设置了3个参数:需要整理的表格名,要整理的列,作为分类依据的变量baselinetable <- function(table_name, cols, index){ table_name <- as.data.frame(table_name) temp_table <- da

2021-05-05 14:21:17 1213 2

原创 常见的犯傻出BUG记录

突然想起自己开始用R语言的时候,经常会遇到一些问题,百思不得其解,最后突然发现是个很愚蠢的问题。那就把它们记下来吧,以后给师弟师妹们看。这一篇不定期更新1. 导出文件时提示无法打开当时我在做的是把ggplot做的图导出成PDF:ggsave(p_death, file = 'I:/p1.pdf', width = 6.4, height = 4)报错是这样的:Error in grDevices::pdf(file = filename, …, version = version) :无法

2021-04-17 23:53:45 1188

原创 GSEA下载的.gmt文件批量处理

从GSEA下载了84个gmt文件,打算把里面的基因名整理出来。0. 先观察一下格式记事本打开几个个文件看了一眼,基本上都是以基因描述+基因名称展现的,中间用制表符隔开。1. 数据读取这里涉及到两个问题:首先是.gmt文件的读取:我用了GSA包的GSA.read.gmt();其次是批量读取的实现:我用了lapply()函数install.packages('GSA')library(GSA)path <- 'D:/immune' #文件的路径fileNames <- dir

2021-04-15 12:32:32 2903

原创 MIMICIV中SOFA评分计算(WINDOWS)

首先声明,这篇的操作有许多需要手动的地方,不能一键生成,也希望以后能有更快捷的手法。之前讲了MIMICIV数据库在PostgreSQL中的安装,今天主要是讲在pgAdmin中调整原代码并生成SOFA评分。0. 谋定而后动在pgAdmin中选中数据库,右键选择Query Tool,接着打开sofa.sql可以看到,除了原生数据之外,sofa评分还使用了icu_hourly, ventilation, vitalsign等衍生数据,如下表:SOFA需要的衍生数据衍生数据需要的衍生数据

2021-04-08 12:35:58 4115 25

原创 Windows中利用wget从网页下载指定图片

0. 首先,为了能在windows上运行wget,需要下载wget.exehttps://eternallybored.org/misc/wget/解压缩后放在合适的位置,我的储存位置:C:/wget接着在将其写入环境变量:运行cmd,输入wget,显示如下图即表示添加成功1.将所需的图片编号整理出来,写成完整的地址:这是用R语言写的示例,用Python之类的都可以dicom_list$address <- paste('http://physionet.org/files/mimi

2021-04-07 11:24:17 1445

原创 PostgreSQL中的时间及常用操作

0. Postgres中的常用时间类型--日期date--时间time--日期+时间timestamp --时间长度interval1. 计算时间差PostgreSQL 没有DATEDIFF()函数,可以用DATE_PART()实现该功能:MySQLPostgreSQLYearsDATEDIFF(yy, start, end)DATE_PART(‘year’, end) - DATE_PART(‘year’, start)MonthsDATED

2021-04-05 15:48:24 4301 4

原创 Postgres安装及MIMIC IV数据库的载入(Windows 10)

Postgres安装及MIMIC IV数据库的载入(Windows 10)上PostgreSQL官网,选个合适自己电脑的版本,下载,安装,没什么问题;注意:中间会要求设置密码,记住自己的密码!接下来是载入MIMIC IV数据库0. 准备工作0.1 在载入之前,先搬运一下Postgres的data文件;默认位置是 C:/Program Files/PostgreSQL/13/data但是为了以后使用的考虑,还是把它搬到一个容量比较充足的地方比较好;我搬运到了我的移动硬盘上:H:/Postgre

2021-04-04 00:34:14 7628 67

原创 MySQL Error 1114

在运行bg.sql的时候,提示Error 1114 (HY000):The table ’ ’ is full.开始,我想着是磁盘空间不足,想把TEMP文件存到C盘以外的磁盘中去。为此,我压缩了G盘,新建了一个H盘,并且在其中建立了文件夹 MySQL_Temp。同时,还要设置该磁盘的权限:属性 > 安全 > 编辑 > 完全控制。在C:/Program Files/MySQL/my.ini,这个配置文件中添加tmpdir = H://MySQL_Temp语句在[mysql]栏下。

2021-03-28 01:09:57 611

原创 Endnote 使用技巧 ----- 在引文中组织与社会团体署名以全称出现

#Endnote 使用技巧 ----- 在引文中组织与社会团体署名的文章以全称出现点开References,在Authory一栏中,在组织名称结尾初添加一逗号,退出,保存在Word中更新引文

2021-03-12 21:12:10 410

原创 R语言绘制陕西省地图并标出几家医院的位置

最近师姐问,能不能把几家医院的位置在陕西省地图上标注出来。今天查了一下资料,整合几位大佬的代码,整理出了用R语言绘制陕西省地图,并标注医院的方法。话不多说,上干活。第一步,调用地图:我调用了百度地图。install.packages("devtools")library(devtools)install_github('lchiffon/REmap') #从百度地图调用地图资料library(REmap)这第一步有一些坑,安装过程不是特别顺利,但是按照它的提示,我试了几次,最终还是成功了。

2020-12-13 13:50:47 2779 30

翻译 量表内容效度检验

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2020-10-27 22:49:55 10934 2

nordpred.zip

Nordpred-PABC所需文件

2021-07-28

nordpred_BAPC.Rmd

BGD-Nordpred-BAPC代码

2021-07-28

concepts.zip

#2021/6/24:三个月前官网做了些更新,主要更新了其中的blood_differential文件,我下载了最新的文件; #只有我用过的文件按postgreSQL的格式要求修改了,有些没有动,需要特定文件可以私信; #MIMICIV的Github代码在Postgres中的实现;比较粗糙,有问题欢迎评论

2021-06-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除