自然语言处理与化学的关系

我是一名在校的应用化学专业的本科生,在选修课上得知了自然语言处理这一热门的技术话题,知道计算机语言更加强调让计算机懂我们人类要做的事,而不是让我们去了解计算机本身的语言,结合自身现在的知识,我说一下我的看法。
自然语言处理讲究的是计算机能实现与人类日常生活中的对话,而对于化学也是如此,我们也可以用这种技术来对各种化学药品进行分类以及查找。比如,在化学里,NaOH以及CuOH等一系列的带有氢氧根离子的金属离子化合物我们都称其为碱,如果我们在计算机语言上输入这些与化学相关的语言,查找某种物质就会变得相对便利一点,做实验时需要什么药品能够迅速给出我们需要的药品的信息以及一系列参数,节约时间和精力,同时对有毒危险物品的分类也能起到很大帮助,如像甲苯,浓硫酸等物质会给我们贴上小心使用的标签。但我觉得最重要的是这种技术能够给我们实验的结果给出一个合理的预测,像做个某种合成实验,我们输入我们用作反应物的化学物质以及他们的用量,它能够给出我们合成后的主要产物化学式以及理论产率,同时可能发生的许多副反应一一罗列出来,让我们实验完成后能有一个做参考的数据,如果像这方面发展我觉得是比较有实用价值的,不管是用在科研实验中还是工业制造业当中。
但是像许多其他专业方面所遇到的问题一样,这种技术在这个方面产生的歧义和麻烦也是很难解决的。先说化学式,在化学里某种物质一般都是用英文字母组合而成的,但是和英文单词又不一样,化学里可以有像二氧化碳(即CO2)这种简单明了的化学分子式,也有许多诸如含有配位键的配位化合物等很复杂的一系列化学式,不像英语句子里单词之间有空格相区分,这些复杂的化学式整个像是挤在一块的杂糅英文字母,没有足够的化学知识很难知道这种物质的真正意义。再者,在有机化学里,分子的同分异构现象十分普遍,像最普通的乙醇(化学式C2H6O),如果仅仅写成这种形式,谁也不知道他究竟是很么物质,他可能是乙醚(化学式结构式CH3OCH3),但也可能是乙醇(化学结构式CH3CH2OH),所以在这方面又需要计算机具备识别和计算物质结构的的能力,像这种简单的物质还好,要是遇到包含几十个碳原子甚至更多的化学式,这会是一个很庞大的计算量,要在这么大的计算量里找到我们需要的那一个也是一个很大的问题。同时,化学里有一种叫做手性碳原子的东西,连接手性碳原子的官能团全部一样,但是他们就像我们的左右手一样,对称却不重合,但化学结构在书写时可以说几乎是一模一样,但是相互的性质又差得很远,仅仅依靠自然语言处理要识别这种手性碳原子也是一个难题。但是在中文里,由于在中文化学里的一些简称也会造成一些困扰,如纯碱即碳酸钠并不是碱,但是在中文名称里它却是有这个“碱”字,很容易造成误解,从而把它归类到碱这一分类里面去,造成一些常识性的错误;再如水蒸气也并不是完全的气体,而是液体水与气态水处于一个相互转化的平衡状态,如果单纯地归为气体的话,就很可能在密度计算上出现偏差。
 以上就是我对人工自然语言处理与化学之间的关系的一点愚见。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值