一份好的研究设计有利于后续数据资料的整理与分析,而保证录入数据的样式,是保证数据质量的重要方面。
Excel,是一个表格工具, 它最主要的功能就是用来"呈现数据", 也就是把数据以需要的形势表现出来, 不光是画格子, 画各种图表, 各种统计分析结果, 甚至打印效果。
而我们做一个课题,是要做一个“数据库",是”数据仓库", 无论是对于数据类型的控制, 字段长度的控制等, Excel都存在很大的缺陷。Excel作为一个通用表格工具, 并不具备严谨的数据类型校验. 很多时候一些似是而非的用户输入, 会让你后面花了大把心思整理校对。
Epidata作为一款免费的数据录入经典工具,在流行病学领域有着比较广泛的使用,Epidata4.6版本是目前最新的版本,它比目前教程最多的Epidata3.1在界面和流程清晰度上有着巨大的提升,但是教程极少,本文对Epidata4.6的功能及优点进行简单的介绍:
1 将Excel数据收集表整理成更直观的文档形式
如果用Excel录数据,你的表格是这样的,可阅读性很一般,尤其在有备注说明的之后,录入数据时更是灾难
用epidata就是这样,非常直观:
2 并且可有详细的备注
3 在你进行录入时,可以提示:
4 在你录入完成一个空白后,会自动跳转到下一个字段
比如这里,通过设置,当我在是否新辅助化疗后
录入0
的时候,会直接跳过新辅助化疗方案
和新辅助化疗疗程
这两空,如果我录入1
,就会跳到新辅助化疗方案
继续录入。
5 在你录错时给予提示:
如果是数字的字段,你录入文本,就无法录入。如果范围不符合,就会报错:
5.1 并且可比较不同变量进行核查
比如,入院时间是2022-12-22,在录入随访时间和死亡时间时,如果随访时间和死亡时间早于2022-12-22,也会报错:
注意此处有显示Bug,是
>= AdmissionTime
5.2 时间也能自动计算:
6 如果表格过长,一些重要信息可以在底部栏查看:
这个是完全可以自定义的,想怎么设置都行
7 当你创建或修改条目时,可以自动记录相应时间:
新建的条目是一个时间,更新的时间可以是另外一个字段,都是自动更新
8 其他
- 可以设置多个表格,用一个关键key(pid)关联,使用较少:
- 可以导出csv、stata、spss多种格式,完全不用担心导出问题
并且R语言中有epidatR
包可以直接读取epidata文件
devtools::install_github("https://github.com/JohannPopp/epidatR")
总结
如果你觉得可以的话,也来用一用吧。