斯坦福用算法降低:令欧洲头大的难民犯罪率

By 超神经


场景描述:6 月 20 日,是「世界难民日」,截至 2018 年,全球难民人数已经近 2540 万,如何将其更好地安置成了国际难题。2018 年 1 月,斯坦福大学和苏黎世联邦理工学院的研究人员发布论文,提出用算法帮助各个国家更有效地安置难民,大大提高其就业成功率。


关键词:监督式学习 最优匹配



在过去 60 多年中,全世界累计有 7.5 亿人因战乱、灾害等原因被迫离开家园,沦为难民。为了引起国际和社会对难民的重视和保护意识,联合国难民署将每年 6 月 20 日定为「世界难民日」


640?wx_fmt=jpeg


前日,由黎巴嫩导演 Nadine Labaki(娜丁·拉巴基)执导的电影《何以为家》,将发生在黎巴嫩贫民窟中的难民生活呈现在大众眼前。


为了躲避战争,主角小男孩赞恩与家人非法生活在拥挤的黎巴嫩贫民窟中。因为难民的身份,他们只能在最不堪的角落里挣扎。


640?wx_fmt=jpeg

获得去年戛纳评审团大奖的《何以为家》

表现难民面临的窘迫生存困境


与现代城市生活相比,电影中的难民生活令人震惊与同情,但对于叙利亚、阿富汗这些饱受战火摧残的国家来说,却是每天都在真实上演各种揪心的故事。


难民:贫穷、动荡和犯罪的代名词


难民是指那些因为战争、自然灾害等原因被迫迁移原居住地、放弃原国国籍的人群。


全球因冲突或迫害离开家园的难民人数近 2540 万(按照难民定义,境内流离失所者不算难民),而这些难民中超过半数不满 18 岁。


640?wx_fmt=png

联合国难民署公布的最新数据


出于同情心与人道主义等原因,很多发达国家欢迎并接收难民。德国、澳大利亚、俄罗斯等都是主要的难民东道国。


640?wx_fmt=jpeg

欧洲不少国家曾热烈欢迎难民到来,如今却备受难民问题困扰


但是,由于文化差异,政策条件,教育就业,社会资源等原因,难民的涌入造成了一些不和谐的因素。


由难民造成的恶性犯罪、地方财政恶化、恐怖主义等愈演愈烈,各国都开始吃不消。


如今,在很多地方,难民成了「不安分」的代名词。


一些国家,从最初的誓要「拯救难民」,到后来出现大批国民上街游行示威,甚至是拒绝接收和驱逐难民,只不过短短数年之间而已。


640?wx_fmt=jpeg

瑞典因为难民的涌入,造成犯罪率大幅上升


根据联合国 2018 年的报告,如果按照现在的难民安置速度,将需要 18 年的时间才能够安置现有全部难民,更不用提今后增加的难民。


维稳妙招:用算法为难民就业择业


面对复杂的难民群体,最重要的解决方案,是对难民进行更加高效、合理的输送和安置,让其尽快适应新家园的生活。


在这个国际问题面前,技术的优点就涌现出来了。


斯坦福大学、苏黎世联邦理工学院的研究团队发现,算法能够提高难民就业几率、增强难民对陌生社会的适应程度,从而帮助各个国家,找到更合适的地区安置难民。


640?wx_fmt=png

该研究已发表于《科学》杂志


研究人员开发了一种灵活的数据驱动算法:可以分析移民安置点的资源状况,灵活输送和分配难民,从而提高整合效果。


该算法结合监督式学习和最优匹配,来发现和利用难民特征与移民安置点之间的协同作用。


测试结果显示,该算法使得难民的就业率增加了 40% - 70%。这种方法可以为政府提供一种实用且具有成本效益的政策工具,可以在现有的体制结构中立即实施。


 1.算法安置难民,共三步 


之前各个东道国已经研究并提出了不同的难民分配方案,比如根据匹配效率或难民和托管地点偏好,确定优化分配。然而,这些方法虽然在理论上具有吸引力,但实际实施起来却存在很多障碍。


相比之下,利用纯数据驱动的方法,可以通过使用现有数据来优化集成结果。该算法分为三个阶段:建模,映射和匹配


- 第一步:用历史移民数据建模


建模阶段:监督式学习过程中,可预测任何可量化指标的成功预期。例如,可预测新的、早期就业难民是否适配潜在安置地点。


研究人员为模型培训分配了历史移民数据,并以单一难民为观察单位,重点关注如原籍国,语言技能,性别,年龄,教育水平,以及到达时间,被分配的地点、就业结果这类数据。


640?wx_fmt=png

难民主要来源国,前三分别是叙利亚,阿富汗和南苏丹


然后使用这些训练数据建立一系列监督学习模型,预测难民就业成功预期与其背景特征的关系。


每个地点的难民都适合被分配一个单独的模型,从而为每个地点产生不同的模型,并从中发现难民与地点的协同作用。然后将这些拟合模型应用于新的样本,以预测每个新的移民安置地点,新到达难民的预期就业成功率。


- 第二步:将个人安置映射至案例级别


映射阶段:将难民级预测从建模阶段转换为案例级度量。为什么要映射到案例级度量?因为难民通常不是基于个人分配到位置,而是基于案例级别,案例通常是家庭单位。


团队首选的案例级指标是预测该案件中至少有一名难民在该地点找到工作的概率。该指标使用了一个简化的假设,即案例中难民的就业概率是独立的。


- 第三步:将每个案例匹配至特定位置


匹配阶段:将每个案例分配到特定位置,在条件限制下,所选择的最优性标准,其算法可以适应多种标准。


在应用中,团队使用的最优性标准是最大化案例级度量的平均值(即,每个家庭中至少有一个难民获得就业的概率的全球平均值)。



 2.提高难民就业,才能稳定社区 



团队评估了算法应用在美国和瑞士的表现:美国,主要根据能力限制分配难民;瑞士,根据比例分配指标随机分配难民。


在美国,接待和安置服务(例如,安排地点分配,难民住房等)由九个志愿机构与国务院合作实施。


640?wx_fmt=png

2018 财年美国难民分布人数统计


在将难民分配给其中一个机构之后,安置官员将难民集中分配到该机构的重新安置地点,但受当地能力限制。


安置人员在难民到达之前就做出分配决定,而不与难民进行面谈。难民在抵达时获得工作许可,并鼓励他们尽快找到工作。


640?wx_fmt=png

美国难民就业率变化数据


为追踪难民重新安置的成功,各机构必须在接待和安置期结束后,难民到达 90 天后报告其就业状况。


为了评估优化安置算法是否可以改善结果,团队分析了最大安置机构之一在 2011-2016年期间,重新安置的工作年龄内的难民(18 至 64 岁)的数据。团队将数据分成训练和测试集。然后,应用拟合模型来预测每个地点的预期就业成功,并确定 2016 年第三季度到达的难民测试集的最佳分配。


对于测试数据,研究人员关注的是可以自由分配到不同安置地点的难民,而不是根据家庭或其他关系所在地分配的难民。另外,他们还对分配施加了限制,在优化分配下,每个地点只能接收少于或等于实际接收的人数。


另外,算法分配大大增加了预期的难民就业率而不是现状分配。


640?wx_fmt=png

美国难民安置中,数据驱动算法的结果与实际结果对比


最终结果显示,算法分配几乎在每个地点都提高了就业率,包括基线就业率较高和较低的地点。平均而言,实际分配下的就业率为 34%,优化分配下的就业率为 48%,这意味着优化分配将使就业率高于基线约 41%。


与很长时间内都难以实施的更昂贵的干预措施(如语言或职业培训计划)相比,数据驱动方法具有更好的成本效益,几乎不需要政府或移民局付出任何附加成本就能实现。


此外,该算法修改了现有的政策流程,促进了实施效率让难民可以更快地融入东道国社会。并且算法是动态的,能随着时间的推移适应协同作用。


我们并不用担心算法会操控一切,它是作为补充,而非取代安置人员。在计算机辅助分配过程中,算法可能会提供若干建议,而安置人员可以自行决定最终分配,或不采取任何建议。


难民问题:不止需要同情心


对于难民问题,不是所谓的同情心泛滥就能改变的事情,也不能仅仅依赖技术去解决,地方和平、政策制度等社会因素,才是去改善这一现状的主因。


但技术的应用,会成为政府、移民局更有效的工具,并提供更有效、更适合的难民安置建议。


希望在各国的努力与技术力量的帮助下,难民与东道国都能够早日摆脱危机。


———— 完 ————


640?wx_fmt=jpeg




历史文章(点击图片阅读)

640?wx_fmt=jpeg

45 年前,我国曾提前 20 天预测出了

 7.3 级的海城大地震

640?wx_fmt=jpeg

618 购物狂欢 | 揭秘亚马逊和淘宝:

如何打造算法成为最佳导购

640?wx_fmt=jpeg

父亲节致敬:人工智能界的技术奠基者们

640?wx_fmt=png 640?wx_fmt=png

AI 百科

教程

数据集

商店

更多

http://hyper.ai

640?wx_fmt=png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值