并非魔法但也有“神力”:我们何时该使用机器学习?


全文共1949字,预计学习时长7分钟

图源:unsplash

 

想象一下,你刚刚从一个临床试验中得到了一个数据集(为了帮你更好地理解,笔者整理了一些数据供你查看),假设这些数据反映了治疗日(输入“特征”)与某个病人在某种奇迹疗法60天的疗程中应接受的正确剂量(毫克)(输出“预测”)之间的关系。

 

#数据:(1,28)  (2,17)  (3,92) (4,41)  (5,9)   (6,87) (7,54) (8,3)   (9,78)  (10,67) (11,1)  (12,67) (13,78) (14,3) (15,55) (16,86) (17,8)  (18,42) (19,92) (20,17) (21,29) (22,94)(23,28) (24,18) (25,93) (26,40) (27,9) (28,87) (29,53) (30,3)  (31,79)(32,66) (33,1)  (34,68) (35,77) (36,3)  (37,56) (38,86) (39,8)  (40,43) (41,92) (42,16) (43,30) (44,94)(45,27) (46,19) (47,93) (48,39) (49,10) (50,88) (51,53) (52,4)  (53,80) (54,65) (55,1)  (56,69) (57,77) (58,3)  (59,57) (60,86) ...

你正在治疗一个病人,今天是第二天。你会建议用什么剂量?

 

答案是“17mg”,这是一个很简单的问题。那第四天呢?没错,是41mg。现在,你将如何开发一个软件以输出1-5天的正确剂量?你会尝试使用机器学习吗?

 

换句话说,可以尝试在这些数据中找到模型并将其转换为从输入到输出的方法(“模型”)吗?答案是否定的。可以让软件完全按照你的方式去做:在表中查找答案。这样一来,将获得60天内所有时间100%正确的答案,不需要模型,也不需要机器学习。

 

什么样的情况需要机器学习呢?

 

现在,假设今天是第61天,剂量的正确答案该是多少?

 

我们从未见过第61天的数据,所以无法在此处查找答案。机器学习可以帮上忙吗?要看情况。如果没有将输入与输出连接起来的模型,那就算了。在那种情况下,没有什么能帮上忙。

如果那是你认为的机器学习,赶紧打住吧,魔法是不存在的。

 

但是,如果有这样一个真实存在的模型,那么可以尝试将其应用到第61天,预测或猜测正确的答案,也许机器学习可以帮上忙。

 

问题在于我们的数据还不足以形成这种模型。如果这样去构建模型,那就太草率了。60天之后,模型结果也必须是接近的。如果第61天的情况完全不同,无法证明模型的有效性怎么办呢?如果第61天所有患者都已完全治愈,或全部死亡,或者正在服用与之相克的药物,那么这种模型会对你不利。

 

不稳定宇宙

如果你的数据对于探索未来没有帮助,或许是因为疫情改变了所有的规则,过往的信息有多好就都不重要了。如果生活在宇宙的一个不稳定的角落,那将很难证实已知的遍历性和平稳性假设,这些假设大致可以理解为“规则没有改变。”

 

图源:unsplash

这不是在说外行眼中的那种不稳定性。当规则是时间的预测函数时,处理平缓的不稳定性就是时间序列分析领域的内容。

 

由于系统的规则根本上是不同的,无法从一个阶段预测到下一个阶段,所以谈到这种剧烈的不稳定性时,我们束手无策。如果过往的数据突然无法用于预测不稳定的未来,就不能用过去直观地预测未来。

 

但如果有一种模型,并且这种模型适用于新情况,那么恭喜你,可以开始了。可以在旧数据中寻找模型,根据它制定一个方法,然后使用它成功获得第61天及以后的数据!找到模型并投入使用就是机器学习的全部内容。

 

何时使用机器学习

在应用机器学习和人工智能时,无需重新思考记忆中见过的示例,只需查找就可以了!人工智能能做的不仅仅是重复旧的答案,它能在新例子上取得成功。

 

你要做的是构建能够成功总结概括的解决方案,要么中止项目。换句话说,如果解决方案无法处理从未见过的新案例,那么就说明它不好。并不是说那些打破稳定宇宙所有规则的全新案例,而是与以往主题稍有偏差的例子。

 

图源:unsplash

我们不像鹦鹉学舌,而是要在这里概括新情况,这就是机器学习的力量和美妙之处。如果你未看到61天前输入值的精确组合,那么正确的输出值是什么?也许可以将旧的模型转变成可以做出合理猜测的方案。

 

例如,你利用成千上万张动物照片训练一个识别猫/非猫的分类器,你可以要求其辨别一张全新的照片中是否包含猫,但是让它告诉你一幅画是否是立体主义风格的显然太难为人了。

 

换种不老套介绍,机器学习是一种自动化重复决策的途径,涉及从算法上找到数据模型并使用这些模型来制定能够正确处理全新数据的方案。

 

机器学习并非无所不能,但也别把它想的太简单了,找到合适的时机再用它,你会得到满意的效果。

 


推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:王娜、高洋

相关链接:

https://towardsdatascience.com/when-not-to-use-machine-learning-or-ai-8185650f6a29

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

展开阅读全文
©️2020 CSDN 皮肤主题: 大白 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值