python爬虫和医学数据_医学论文中的数据有什么软件可以对之进行收集和处理吗?爬虫?...

本文介绍了在医学领域如何通过Excel、Epidata数据录入工具以及编程语言如Python处理数据,强调了不同方法的优缺点,并推荐Epidata作为入门选择,同时提到了数据处理和分析常用工具如SPSS和Python/R.
摘要由CSDN通过智能技术生成

主要看你是什么数据,要做什么。

一般医学领域数据提取录入也就下面这些方法:

Excel:直接建一个 Excel 然后表头列好你要录入的哪些数据,然后一行一行录。优点:最简单方便;格式通用,后期处理基本上所有软件都能读取,直接 Excel 也能一定程度进行分析。缺点:人工工作量大;所有数据前后格子贴着,一不小心弄错了不好排查;多人录入的话不好交叉核对(会写脚本的话忽略这点)。

Epidata:数据录入工具,根据软件流程创建相应录入模板然后录入,最后导出需要的格式。优点:工作流程清晰,可以一定程度提高录入质量并减少工作量,可以导出多种格式用于后期处理;软件提供多种质量控制和校验功能。缺点:软件有一定学习成本;多人录入需要每个人都有软件并且会进行录入(软件倒是可以不用安装直接打开用);软件版本比较旧,字段和样本最大数量的软件上的限制,而且好像是英文的(好久没用了,具体忘了,不过好像有出新的系列,改动挺大,我没试过)。

Python/R/等其他编程语言:根据相应语言编写代码提取数据。优点:代码编写完成后可以反复使用,省人工;自由度高,可以进行各种骚操作。缺点:学习成本高,对于初学来说学习时费的人工很可能比后期省的要多得多得多。

========= 我是可爱的分割线 =========

编程的方法学习成本高,之前没接触过还是不推荐,毕竟你们不是计算机专业的,真要尝试可以去了解了解 Python 还是比较好上手一点。我个人对数据录入还是推荐 Epidata,因为质控好而且写好录入模板的话可以方便很多。但是因为我是自学过编程,所以写起来还顺手,没接触过的可能会稍微需要一些时间。懒的话那就直接 Excel 吧,也差不了太多。

还有如果你是从论文(PDF)中提取的话,脚本的可操作性很低;如果是网页或者什么规范的数据库上的数据用脚本是有很大优势的。

所以看你的问题的话,还是建议先去看看 Epidata 能不能接受,不行的话直接上 Excel 吧。

========= 我也是分割线,我不知道我可不可爱 =========

然后数据处理这个可就有的说了,得看你具体啥数据,要分析啥,这里没法说清楚。至于工具的话也就是那些统计软件,SPSS 一般就可以,还有 SAS,Stata 啥的。如果是要用新方法或者复杂点的方法可能后两者,或者 Python / R 会更合适。

具体没法展开,就酱。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值