【Python】核酸结果统计难?复旦博士生的操作火了......

来源:中国青年报

编辑:学妹

01233409bfd8e3c9b90f811452672d0f.gif

人工核查核酸报告费时费力又易出错,怎么办?

4月7日,复旦大学官微发文,自三月初以来,学校启动常态化核酸筛查工作,要求班级辅导员必须核查学生“健康云”核酸完成截图,确保“不漏一人”。

学校信息科学与工程学院博士生李小康的操作火了,几分钟就能快速核查数百人的核酸完成截图,大大提高核查效率和精度53b7d6f38477c2e5e3d9f6e73c91b087.png

faf1b0ba2fb77f0d48e7eb2c665b5b90.png

从1小时到2分钟,一串代码搞定

据了解,李小康目前担任学院2019级信息1班辅导员。

对于核查核酸报告的工作,他表示:“听起来好像很简单,但实际做的时候,一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会看错看漏。”

3ae853c35543917881e7231d7bbf99b9.png

李小康正在做志愿者

作为生物医学工程专业博士生,他的研究方向是医学影像与人工智能,平常会接触很多图像处理方法。李小康第一时间想到以前学到过的OCR (Optical Character Recognition,光学字符识别)技术。

“OCR可以把图像中的文字识别出来,转换为文本信息,就方便用来核查了。而且因为核酸截图是打印字体,识别率非常高,几乎可以做到100%准确。”

他还想到了Python语言中的正则表达式——可以搜索到字符串中的特定模式内容。

“使用正则表达式就可以把想要的信息从OCR识别的文本中筛选出来。最后,确认好每张截图里的姓名、检测时间和是否已采样等信息后,再把所有人的结果输出到Excel文件中,方便人工确认。”

最后,李小康确定了“OCR文字识别+正则表达式筛选”的程序思路。3月15日晚,他花了一个多小时就写出了初始代码,共130行,发现确实能够跑通,且运行效率很高。

2259541ffa60e152fa99370ae1353931.png

李小康最初写程序时和学工同事的聊天

程序一写好,李小康就在自己班级的核酸截图数据上进行验证,准确率果然很高,甚至检测出了之前人工核查没有发现的问题。并且,程序运行时间很短,80多张图只需要20多秒。

复旦大学:有望全校覆盖

目前,程序已在该学院服务2周。李小康曾让别的老师试用自己的程序进行核查。800幅截图,原来要几个人核对一个多小时,现在只需等2分钟就拿到结果。

45d4633d0c2088597ea3c9d4c3801288.png

他把这件事发到朋友圈之后,不少同事表示很感兴趣,他还把代码分享了出去。为了方便不会编程的老师使用,李小康最后还把程序进行了封装——用的时候,只要在命令行输入一行代码就可以运行。

f55f54b40ba4448acefafd6129f8ed9d.png

程序输出的Excel文件

据了解,学校信息办也与李小康对接。预计在不久的将来,师生们就可不用再手动收集核酸截图,而是通过小程序直接上传图片,可在后台随时查看统计结果。

83f9010bebb5e6a48ebc4d265220bf3b.png

641be5ef0ec666c4a09c55584305c79b.png

0aafa4a69ffbd9213d9d225b3e77d1fa.png

283b95f2cedc719839548698ff46c015.png

今天下午,中国青年报记者试图与李小康取得联系时,他正在学校楼栋担任志愿者送饭。

他说过:“原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。我只是用我学到的知识解决实际工作中的困难。”

用所学贡献青春力量!

为李小康点赞

309293884ff4ed936d357ce9df42e3fd.pngc275c6e28e558b0c977c24723e7346c2.pngf39812a207618a891c902ce15c08115e.png

d7436aa20f5b2ece265d1e58dd59453f.png

 
 
 
 
 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

946aafd5d91e65892bb8abae70ff10c9.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值