“To be , or not to be:that is the question”(生存还是毁灭:这是一个问题),这是著名的莎士比亚悲剧《哈姆雷特》中的主人公一句非常经典的独白,也是数百年来经常困扰人们的选择问题。这段哈姆雷特式问题的台词,经常用来形容一个人在犹豫在思考时候的两难情况,用现代人的说法就是“选择困难症”。人们经常纠结于各种选择,生怕选错了,就会陷入“蓝瘦香菇”的困境。
人们在面临选择难题的时候经常想:如果能未卜先知,那该多好。实际上,在人工智能领域,就有一种预测算法,利用树杈的形状,非常形象地来解决这种选择问题,这就是决策树算法,它是一个非常广泛应用的算法,其原理是通过对一系列问题进行“是/否”的推导,最终实现决策。在机器学习发展到如今,决策树算法越来越得到更多的应用,我们也可以说它是解决“选择困难症”的良药。本文为了让读者朋友较好理解该算法,用python编程进行一个实际应用的示范。
新冠检测和决策树的基本原理
决策树算法是一种典型的、逼近离散函数值的分类方法。主要是先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。决策树算法应用非常广泛,例如在目前新冠疫情下,由于核酸检测条件和资源有限,不能够对所有人都进行检测,因此对有疑似感染人员的一些行为特征进行推导,最终判断其是否需要进行核酸检测来进一步确诊,也是很有必要的。比如调查和征询病人的近期行为:“去过医院或高危聚集地、防护措施是否到位、有病患接触史、是否发烧咳嗽”,这四个行为特征来判断是否需要对该人进行核酸检测,从而进一步确诊。