自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 【Office AccessDatabase Engine 安装错误解决】

Office AccessDatabase Engine 安装错误解决

2024-08-15 16:45:12 869

原创 基于GBD数据的年龄-时期-队列模型构建

APC 模型应用于估计年龄时期和队列三者独立因素对慢性非传染性疾病发病率或死亡率的影响。

2024-06-05 17:32:02 2362

原创 R语言中调用SQL语言进行数据处理

R语言中调用SQL语言进行数据处理

2024-02-29 17:22:03 518 1

原创 循环语句中输出进度条---------------%

循环语句中输出进度条---------------%

2024-02-29 16:25:40 447 1

原创 心脑血管疾病超额死亡分析——基于低温寒潮影响

近期低温寒潮天气再度来袭,不知道大家有没有感受到,近年来我国寒潮天气发生频次逐渐增加。环境温度,是影响心血管健康的一个重要因素。在体温调节的控制下,我们的体温总是基本恒定的。大约在25℃时,我们体内的毛细血管舒张平衡,感觉非常舒适。而较大幅度的气温下降对心脑血管健康不利,冷空气活动会明显导致心脑血管疾病发生、加重甚至死亡风险。因此在工作或科研中总是会考虑到低温寒潮到底会造成心脑血管疾病多大程度的影响,故引入了超额死亡的研究方法。

2024-02-02 10:47:17 184

原创 基于GBD数据绘图之——热力图

日常工作中,热力图可以直观地表现数据的分布情况,通过颜色的深浅和亮度的变化,可以让人更好地理解数据密集程度和趋势。尤其是在公共卫生领域,对于大样本量流行病学数据进行更好且直观的可视化展示。

2023-11-06 17:37:31 480 1

原创 基于GBD数据绘图之——双Y轴图

GBD数据库由美国华盛顿大学健康测量和评价研究中心 ( Institute for Health Metrics and Evaluation ,IHME )的全球疾病负担( GBD )项目研究组牵头建立,提供了自 1990 年以来全球 204 个国家和地区的 369种疾病、伤害和健康危险因素的流行病学数据 ,并定期对数据库进行更新发布。近期对疾病负担研究颇感兴趣,在日常监测数据中也会经常用到,查阅了一系列paper,发现一张精美的图片,能将分析数据完美、直观的展示。本期文章就GBD数据进行双Y轴图的绘制。

2023-10-24 17:15:31 673

原创 【R语言-基于“periodR”包进行生存分析】

生存率的计算方法有多种形式,以纳入诊断时间和随访日期的差异可分为队列法、完全法、现时法和预测法等。本文运用“periodR”包进行多种生存分析方法的比较。

2023-06-26 16:02:26 664 2

原创 【R语言-生存分析之相对生存率计算】

由于人群的肿瘤登记工作中死亡患者通常由生命统计系统推送或者在基层工作者随访中发现, 患者的根本死因资料可信度不高,因此,以人群为基础的生存资料分析中通常用相对生存估计法计算净生存率。

2023-04-13 15:22:57 1182

原创 【R语言-生存分析之观察生存率计算】

全人群肿瘤登记资料常用的统计分析指标包括发病率、死亡率、现患率以及生存率等,其中肿瘤生存率是评估肿瘤治疗效果和肿瘤负担的必要指标,其计算涉及肿瘤患者的发病、 死亡和随访三个方面的资料, 数据整理和计算过程均较为复杂, 如何及时、 准确地计算肿瘤生存率, 并使其可以在不同地区、 不同人群、不同时期间被客观公正地比较和评价,仍然是统计学家们一直在研究的主题。

2023-04-13 15:03:45 3653 2

原创 ARIMA模型构建

ARIMA(autoregressive integrated moving average model)模型由Box与Jenkins于上世纪七十年代提出,是一种经典的时间序列预测模型。

2023-03-03 17:31:01 818

原创 时间序列模型分类及应用

时间序列本质上反映的是某个或者某些随机变量随时间不断变化的趋势,从数据中挖掘出这种趋势变化规律,并利用其对将来的数据做出估计和预测。其可以反映社会经济现象的发展变化过程,描述现象的发展状态和结果;可以研究社会经济现象的发展趋势和发展速度;可以探索现象发展变化的规律,对某些社会经济现象进行预测。一直以来在金融领域(股票走势、期货价格等)应用较为广泛,近年来在医疗卫生领域,传染病发病、非传染病健康结局指标等方面发挥越来越重要作用。

2023-03-03 16:14:03 2069

原创 R语言进行长宽数据转换

在日常数据分析过程中,经常会对数据进行长宽转换处理,所谓长宽数据转换就是将数据表中的列变量进行聚合和分裂操作。

2023-02-17 15:34:20 2510

原创 R语言多个for循环嵌套使用

R语言——多个for循环联合使用提高数据处理效率

2022-07-20 16:17:58 6625 1

原创 R语言连接外部数据库

数据库管理系统在日常监测数据收集、质控过程中发挥着重要作用,access数据库存储方式简单,界面友好,操作简便,在处理数据过程中能够极大提高效率。但是将大批量数据导出为excel,到R软件中进行一系列统计分析时,导出速度较慢,极易卡顿。有没有一种方式能够直接用R调用access数据库呢,RODBC包应运而生。...

2022-07-11 17:18:47 603

原创 【R语言 个性化词云图绘制(MamBa never out)】

MamBa never out

2022-05-31 21:28:00 206

原创 【R语言 南丁格尔玫瑰图绘制】

继续上一篇地理信息可视化讲起,为了能够更加直观的展示数据分布情况,发现之前人民日报客户端曾经做过一张关于疫情分布的玫瑰图,非常惊艳,故尝试用当前爬取的数据进行绘制。绘图前数据整理现存数据中不少地区病例已经清零,故在绘图中剔除为0的地区,由于弯弯的数据太过于扎眼,和大陆地区差异巨大,直接用原始数据绘图可视化较差,故对原始数据进行了相应调整。library(ggplot2)library(RColorBrewer)library(dplyr)###绘图数据处理###mydata[,c(1,3)]%

2022-05-28 13:58:37 1966 1

原创 【R语言】地图信息数据可视化

最近需要对国内疫情分布情况绘制可视化地图,查找资料R中地图绘制思路,显示在R中绘制地图主要有三种方式:第一种是利用某些特定R包中自带的地图数据进行绘图;第二种从其他途径获取地理信息数据,调用相应的软件包对数据进行读取,进而绘图;第三种是基于某些供应商的tiles与Google、NASA、高德等网络在线地图相关联,调用其地图数据为自己绘图所用。下面进行举例说明:1.【绘图前准备】爬取丁香园每日疫情数据##加载程序包,设置路径##setwd("f://data")library(rvest)libra

2022-05-27 14:48:35 4826

原创 【从网上批量下载图片】

从网上批量下载图片【R语言】最近需要从国家统计局网站上下载一批统计年报数据,打开网址发现数据均是以图片形式存放,那么该如何批量获取呢,几行代码搞定。首先打开网页中国统计年鉴,点击左侧任意目录,单击右键审查元素,会在右侧栏中显示该数据图片的链接地址,通过观察发现链接地址有一定排列规律可寻:依据规律写个循环下载图片,代码如下:setwd("f://test")library(stringr)for(i in 1:9){##下载9张图片到本地test文件### url<-str_c("htt

2022-05-12 10:37:48 252

原创 R语言对数据框进行循环处理

最近遇到一个问题,需要对不同分类区域的相关研究指标进行特定的分析,因为涉及分类较多,使用循环赋值语句进行分类,直接上代码:举例:假设原始数据为由A区-J区的10个分类区域(如图);第一种方式:循环生成多个list下存放的数据集library(dplyr)library(stringr)###使用filter函数将数据转存到list数据集中###mc<-mydata$ad%>%table()%>%names()kk<-list()for(i in 1:l

2022-04-16 23:47:37 6240

原创 R语言进行随机抽样、分层抽样和系统抽样

最近在进行一项哨点监测项目,需要对监测点乡镇、学校和医疗机构分别进行人口规模排序的系统抽样、学校类别的分层抽样以及随机抽样,对比spss、excel后发现R语言中的sampling包能够得到较好的实现,直接上代码。原始抽样框如下,分别存放与excel不同的sheet中:代码部分:library(readxl)library(dplyr)library(sampling)dt<-list()for(i in 1:3){ dt[[i]]<-read_excel("x

2022-04-14 23:00:15 5132

原创 批量读取和写出excel数据#R语言#

运用R语言处理数据时总会遇到大批量excel数据读取和写入的问题,以R中的iris数据集举例,主要有以下几种形式(直接上代码):读入数据:1.将多个excel数据批量读入R环境中(读入csv格式文件为例):#将D盘data文件夹下的"setosa","versicolor","virginica"批量读入R环境下KK集中#bb<-c("setosa","versicolor","virginica")kk<-list()for(i in 1:length(bb)){

2022-04-08 23:32:35 3200 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除