是谁还在手绘结构式?画个甲苯一秒钟,遇到复杂天然产物(如紫杉醇、青蒿素等)堪称炼狱!画完还得仔仔细细校对碳数、手性等等细节问题,就算是细节控也会崩溃十秒钟。大家对微信OCR文字提取如数家珍(长按图片→提取文字),但涉及化学结构式识别这一专业领域却鲜有人知其智能化解决方案已实现技术突破!谁还在手画结构式,我都会心疼30秒的……
其实经常冲浪的化学专业的同学应该都会注意到,市面上已有多款免费开源的应用OCSR(化学结构识别)技术进行化学结构提取的工具,如Collector、Img2Chem和InDraw。到底哪个最好用?哪个软件是真免费还是套路?哪个工具准确率最高?比来比去也花费不少时间,小编这次就来个全面分析,告诉大家最好用的一款~也可以根据软件不同技术特点自己选择使用,本期干货满满,提高大家的科研效率!!!!节约时间的小伙伴,拉到文末有总结表格哦!
先了解下OCSR(光学化学结构式识别)技术发展历程。OCSR(光学化学结构式识别)技术发展历经三大方法论迭代,其核心目标在于将二维化学结构式图像转化为计算机可解析的分子拓扑数据。技术实现路径可解构为:
1. 基于规则的系统(1990s-2010s)
原理:依赖人工预设的化学键连接规则(如碳四价原则)、原子坐标计算与符号匹配算法
局限:需预先建立化学元素/官能团特征库,对复杂结构(如稠环芳烃、立体异构体)识别率不足60%
2. 机器学习驱动(2010s-2018)
突破:引入SVM(支持向量机)、随机森林等算法,通过特征工程自动提取原子间距、键角等几何参数
典型应用:早期Img2Chem工具实现80%准确率,但对低分辨率图像仍存在误判
3. 深度学习革命(2018至今)
技术跃迁:采用卷积神经网络(CNN)与图神经网络(GNN)协同架构
CNN模块:定位图像中原子符号(如C/N/O)、化学键(单/双/三键)及手性标记
GNN模块:构建分子图拓扑,验证价键规则与立体化学合理性
成果:以InDraw为代表的工具具有较高的识别准确率,支持紫杉醇等复杂天然产物的SMILES/SDF格式输出
接下来小编依次测评InDraw、KingDraw、StoneMIND、摩熵化学。测试分子分别是:复杂化合物图1、手写结构式图2
图1
图2
一、InDraw
InDraw是一款由鹰谷自主创新和研发的化学结构式编辑器。有网页和客户端两种版本,免费且正版。为科研工作者提供简单、易用的绘制化学结构式、反应式、流程图和生物绘图等的工具。同时,整合AI人工智能图像识别技术,把图片格式的化学结构,识别为可以重新编辑的结构。InDraw可用于绘制有机化合物、有机材料、有机金属、聚合材料、生物聚合物、生物信号通路、流程图等。已经被5万多人使用,用户遍及各大高校、科研院所和企业。
官网地址:https://www.integle.com
Indraw网页版暂时没有结构识别功能,得下载软件。
效果整体不错,化学键基本没缺失,有问题的部分还自动标识了蓝框,结构较为拥挤的部分还是有些问题。
看看手写效果~
呃...苯环少了一根键,也有一些很明显的错误,整体上修改的地方还可以接受吧。
二、KingDraw
Kingdraw是一款专为化学学习和研究设计的软件,具备强大的图像识别功能,旨在提高化学结构式的绘制效率和准确性。KingDraw可兼容cdx、mol、SMILES等多种常用结构式绘制软件的文件格式,并支持ACS1996等多种绘图标准。支持手机、Pad、PC一键同步,满足不同场景创作要求。
官网地址:https://www.kingdraw.cn/
由于KingDraw是个类似于ChemDraw的专业化学结构绘制工具,功能多样,软件较大,下载起来速度有点小慢...
KingDraw对复杂分子的结构识别效果很不理想呀,错误有点太多了。不过分子的整体骨架还是比较清楚的,在细节上还得花时间校对修改。
KingDraw对手绘结构识别效果还是较大的有优化空间,不过楔形键还是识别出来了,有点点欣慰。
三、StoneMIND
StoneMIND Collector,简称Collector,由望石智慧产研团队开发,已于2021年9月正式推出Windows和Mac版本,Collector基于OCSR(化学结构识别)和IUPAC(标准化学名称识别)技术,能从专利和文献中提取化学结构,并将提取的结果导出为计算机可读的格式(sdf/mol/smiles/xls),帮用户解决“画结构式时,耗时长且易出错”的问题,所有用户均可免费下载使用。
官网地址:https://stonewise.cn/
软件界面简洁,下载方便比kingdraw轻量化,点击“识别结构”截图即可。
望石对截图中的分子识别结果还是不错的,缩写基团也能识别出来,只有较为拥挤的部分有点点小错误,整体上没有很大的问题。分子整体也没有旋转,识别完成后校对一下就好啦!很方便。
上个难度再来试试手写体!
手写结构的识别效果有点点不尽人意了,苯环、楔形键无法准确识别,不过识别文献和专利中的结构,也是够用了。
按照这个测评趋势,效果是越来越好~
四、摩熵化学
摩熵化学是一款针专为化学研究开发的化合物检索及合成设计平台,为化学合成研究人员提供化合物及反应信息查询服务。作为全球首个以网页端为主,移动端为辅的多终端一体化学合成“口袋工具”,产品数据覆盖化学合成实验的全周期,有效解决有机化学实验周期长、化学信息分散、反应数据查询困难等关键问题,提供高效专业的解决方案。摩熵化学凭借亿级化合物信息和千万级化学反应数据,成为化学家攻克科研难题的智能工具,为相关学科人员轻松打开有机合成的大门,助推中国化学研究走向更高水平。
官网地址:https://chem.molaid.com/home
摩熵化学并没有提供专门的软件,而是在官网的编辑器中增加了结构式识别功能~电脑内存小的童鞋们有福啦!
两个地方都有结构识别的功能
我天,我认认真真的看了两遍也没找到错误诶,小编可没偏心~不信的同学们找找有错误吗?竟然完全一模一样,我真的发现了什么好用功能啊,不枉费捣鼓了半天...
不会手写体也能交个满分答卷吧!
让我们来瞅一瞅~
挺不错的,摩熵化学识别手写结构功能挺强大的,苯环、楔形键完美识别,只有一点点小问题,两个碳没有连起来,拉一下就好了,再用结构整理功能标准的结构就水灵灵的绘制好了!
这效果真是出乎我的意料...
看官网介绍说微信小程序也有该功能,那就直接用手机拍实验本上的结构识别出来放在组会ppt中,那就是分分钟的事吧
测评结束,给大家总结了一下,大家可以根据软件特点选择使用哦~
名称 | 文献结构 | 手写结构 |
InDraw | 化学键丢失、增加;原子识别有误 | 苯环识别失败,化学键、原子识别错误 |
KingDraw | 化学键丢失较多,错误较多 | 效果不好,但能识别出楔形键 |
StoneMIND | 化学键连接错误,整体不错 | 效果不好 |
摩熵化学 | 无话可说,够强!100昏儿~ | 有点小错误,问题不大 |