临床数据录入神器Epidata4.6

本文介绍了Excel在处理复杂数据和严谨性上的局限,推荐了Epidata4.6作为数据录入工具,强调其直观性、类型校验、自动跳转和错误提示等功能,特别适合流行病学研究,支持多种格式导出和R语言集成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一份好的研究设计有利于后续数据资料的整理与分析,而保证录入数据的样式,是保证数据质量的重要方面

Excel,是一个表格工具, 它最主要的功能就是用来"呈现数据", 也就是把数据以需要的形势表现出来, 不光是画格子, 画各种图表, 各种统计分析结果, 甚至打印效果。

而我们做一个课题,是要做一个“数据库",是”数据仓库", 无论是对于数据类型的控制, 字段长度的控制等, Excel都存在很大的缺陷。Excel作为一个通用表格工具, 并不具备严谨的数据类型校验. 很多时候一些似是而非的用户输入, 会让你后面花了大把心思整理校对。

Epidata作为一款免费的数据录入经典工具,在流行病学领域有着比较广泛的使用,Epidata4.6版本是目前最新的版本,它比目前教程最多的Epidata3.1在界面和流程清晰度上有着巨大的提升,但是教程极少,本文对Epidata4.6的功能及优点进行简单的介绍:

1 将Excel数据收集表整理成更直观的文档形式

如果用Excel录数据,你的表格是这样的,可阅读性很一般,尤其在有备注说明的之后,录入数据时更是灾难

用epidata就是这样,非常直观:

2 并且可有详细的备注

3 在你进行录入时,可以提示:

4 在你录入完成一个空白后,会自动跳转到下一个字段

比如这里,通过设置,当我在是否新辅助化疗后录入0的时候,会直接跳过新辅助化疗方案新辅助化疗疗程这两空,如果我录入1,就会跳到新辅助化疗方案继续录入。

5 在你录错时给予提示:

如果是数字的字段,你录入文本,就无法录入。如果范围不符合,就会报错:

5.1 并且可比较不同变量进行核查

比如,入院时间是2022-12-22,在录入随访时间和死亡时间时,如果随访时间和死亡时间早于2022-12-22,也会报错:

注意此处有显示Bug,是>= AdmissionTime

5.2 时间也能自动计算:

6 如果表格过长,一些重要信息可以在底部栏查看:

这个是完全可以自定义的,想怎么设置都行

7 当你创建或修改条目时,可以自动记录相应时间:

新建的条目是一个时间,更新的时间可以是另外一个字段,都是自动更新

8 其他

  1. 可以设置多个表格,用一个关键key(pid)关联,使用较少:
  2. 可以导出csv、stata、spss多种格式,完全不用担心导出问题
    并且R语言中有epidatR包可以直接读取epidata文件
devtools::install_github("https://github.com/JohannPopp/epidatR")

总结

如果你觉得可以的话,也来用一用吧。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值