一般数据保护条例(GDPR)对数据科学产生了很大的影响。现在GDPR有99条正文条款和173篇声明(Recital),长而复杂,但是随着时间的推移以及条款的执行,它可能会变得更加复杂。同时,由于GDPR的存在,律师和隐私工程师将成为未来大型数据科学项目的核心组成部分。
本文主要讨论GDPR与机器学习(ML)之间三个最常见的问题。
1.GDPR是否禁止机器学习?
总的来说,在GDPR生效后,ML不会在欧盟被禁止。
但是,从技术的角度来看,这个问题的答案是肯定的。GDPR作为法律条文,确实做出了对使用自动化决策的全面禁止的规定。当GDPR使用“自动化决策”这个术语时,该法规指的是任何模型都可以在没有人直接参与决策的情况下做出决定。这可能包括数据主体的自动“概要分析”,例如将其分类为“潜在客户”或“40-50岁男性”等特定组,以确定贷款申请人是否有资格获得贷款。
因此,GDPR对ML模型的产生的影响是在没有人直接参与决策制定的情况下,它们是否可以自动部署。如果可以自动部署,那么在大量的ML模型中这种自动部署的设置将会被默认禁止。尽管有许多律师或数据科学家确实反对过,但参与起草和解释GDPR的欧盟官方工作组还是坚持该项规定。
当然,GDPR禁止ML也有例外情况。简单来说,该法规确定了使用自主决策合法的三个领域:合同处理的必要性,其他法律另行授权的情况,或数据主体明确同意的情况。