先前写了篇网文《零成本建立中小型医学数据库》,将自己对建立医学数据库的一些思考和大家分享,然而内容思考多于实践,最近有机会将自己的一些想法付诸于实践, 为普外科建立一个甲状腺癌的小型的数据库,实践过程中,验证了之前文章中的一些想法,也对之前的一些想法进行了妥协, 也对建立医学数据库有一些新的了解。
一、之前文章中思考了三个方面
数据库采用MySQL作为载体
这与之前的想法是一致的, 这次用的是windows系统, 之前考察的是xampp这个软件包,但是其控制台在退出的时候总是报错,感觉稍有缺陷,进而转到wamp上,两者在形式上差不多, 目前来看后者用起来更加顺畅,更加适合windows系统。
建一台Linux的服务器然后用xammp或许才是最便捷的解决办法。
形式上,借鉴CDISC和MIMIC
CDISC和MIMIC都是关系型数据库的规范。CDISC是为进行随机对照临床试验提交数据建立的一套标准,从变量名到收集数据的内容都有明确的规定, 原来想以CDISC的规定来确定手头医学数据库的内容和形式,但是显然这套标准对于一般应用来说过于复杂,特别是英文缩写的变量名非常难以理解和记忆,所以基本上放弃了, 但是CDISC的一些核心理念还是对建立自己的数据库有很多的借鉴;而MIMIC是著名的公开的医学数据库,与我们的任务更加相似,可以说是一个典范,对我们数据库的建立有很多的借鉴,特别是通过对MIMIC数据库的学习, 对数据库后续的数据查询和使用过程有预先的了解,也对数据库的设计有了很多的启示。
内容上,专家意见和文献查询为主
在搜集哪些变量这个问题上,专家意见和文献查询是肯定要参考的方面,原来还设想了要参考结局指标核心数据集(COS),但是目前的甲状腺癌领域还没有COS进行参考,只好先放弃了参考COS。
二、实践中新的问题
如何便利数据录入?
1.将数据库建立在一台服务器上,直接在phmydamin客户端录入数据, 所有的数据在服务器终端上进行录入。
2.在1的基础上,对MySQL数据库设置局域网的访问,可以在手机或平板以及电脑多台终端进行数据录入:采用的是WAMP服务器, 局域网访问的话需要设置3个方面(大家结合网上已经有的教程看):1. 修改Apache的config两个文件(如图),2.alias关于phpmyadmin的一个文件(如图);3.电脑添加8080(我的是8080)和3306端口(这里给个站内的链接供大家参考https://blog.csdn.net/qq_43453731/article/details/96869664)。到这里其它的都可以先不用设置, 手机或这电脑在同一个局域网内的话都可以输入服务器电脑的IP地址(有的说一定要固态IP,我也没去验证)通过phpmyadmin进行访问mysql数据库。3.在excel终端录入数据,导入mySql服务器。
4.可不可以与Epidata数据录入软件相结合来录入医院的数据?熟悉Epidata的同事基本否定了这个想法,Epidata录入的形式适合流行病学调查表,首先要有一个调查表格,但是构建一个调查表格似乎也可以在考虑范围之内。
5.其它录入方式。中间有同事建议从医院信息科导出数据, 有待体验一下才能理解。
三、临床数据存在不准确的情形
最准确的是病历本上的数据,电子病历中的数据可能存在误差。
发生的环节:目前都是电子病历,医生撰写电子病历的时候存在复制/黏贴的情况,这个环节可能回出现问题。
###待续