python与医学统计_医学统计思维-数据库

数据分析是统计中最常用的技能,但是数据从何而来,许多是根据一个想法临时收集,这个想法来源可能是仙人指路,也可能是自己阅读文献或是临床实践的灵光一闪,又或者是突发奇想,然后想验证一下。无论哪一种,都是正向思维,由想法到数据收集,但许多人是没有仙人指路的,也没有大量阅读文献的技能与习惯,也缺乏敏锐的洞察力。

在读研时,由于毕业论文需要,我收集了1个小方向的数据库,大概300~400的样子,拿这个毕了业,再毕业一年后,一个师妹找到我,需要当时的数据库,因为统计套路有了,想法有了,可是没有数据,又由于疫情原因,无法到医院自己收集,进度、速度大大受阻。此时我也正在学习数据挖掘,回看自己当时的做的数据库,漏洞百出、粗制滥造,原因很多,比如源头数据的不准确、源数据无法溯源、建库思路模糊、数据改动无记录、无区分都影响了数据库的再次开发利用。正在学习数据挖掘的我也面临一些问题,由于积累不够,还没有建立一个对临床科研系统的认知观,正向思维下我无法开展工作,正向的思维需要一个明确的研究假设,然后开题,进行数据收集,最后通过数据分析验证假设。举个例子,正向思维就像挖X矿,你首先要找一个地方,然后开始挖洞,验证是否真有一个X矿。这对你的勘探定位能力要求很高,需要大量的经验积累,你才有能力找到一个可能有X矿的地方。但是目前我还不具备这种能力。

怎么办呢,坐以待毙吗?我喜欢拆东西,以前有个词叫山寨,换到工业界叫逆向工程/逆向制造。

有正向思维,也就有逆向思维。

逆向思维更加适合小白的情况,没有明确的方向,但是先把数据收集起来,然后通过对比数据,统计分析,发现规律,提炼假设,就想矿石精炼一样,但是我也不知道最后练出来什么矿,也许是金矿,也许是煤矿。正向、逆向,没有好坏之分,第一种方式比较适合王者段位的玩家,对资源、技术、意识要求较高,第二种方式更适合青铜玩家。反观我建立的第一个库,我获得哪些经验呢?

1. 没有研究该领域的高分文章,收集的变量不全。

2. 没有随访工作,单薄的数据,缺少了时间的可能性。3. 建库过程缺少记录。4. 研究有回顾研究也有前瞻研究,建库也有回顾建库与前瞻建库,没有持续做下去改进。临床工作是繁琐的,建库工作也不是一个人能完成的,最理想的模式是研究生进行录入工作,上级医生负责质控。医院的信息化建设也是助力,所有数据之源是初始录入,如何规范是学习、协调的工作,如何提取是一个技术手段,R语言、python可以做数据清洗,但是清洗工作是依据特征进行的,就想限制性内切酶,需要特定序列,进行提取,这个又回到初始录入工作了,怎样给关键信息打标,以便以后补录工作顺利高效,需要学习数据清洗,最简单的,excel是怎么拆列的。

成长很慢,现在才有一点点想法,希望有一天实现专业方向临床、标本、组学三库合一。我也在一点点进行

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值