文|梁仕威(花名:栖川)
蚂蚁集团算法专家
方略平台技术负责人,专注于分布式计算领域,主要负责蚂蚁基础算法的分布式设计与开发。
本文 3419 字 阅读 9 分钟
在类似安全风控这种对抗性的场景中,由于欺诈者作案手法的频繁变化,使得训练数据并不总会包含足够的信息给算法自动挖掘出优质的拦截规则,这种场景下高质量拦截规则的挖掘需要结合专家领域知识。如何将算法和专家领域知识相结合成为了业界一个值得探索的课题。蚂蚁集团 AI Infra 团队针对上述问题,构建了一个交互式的规则研发系统——方略,提供了一种在规则研发过程中高效融入专家领域知识的解决方案。
描述该系统的 Demonstration Paper《Fanglue: An Interactive System for Decision Rule Crafting》近期已经被数据库领域的重要会议 International Conference on Very Large Data Bases (VLDB2023) 所接收。VLDB 是中国计算机学会 (CCF) 推荐的 A 类会议,每年都会吸引国内外各大高校和科技公司的投稿。
1►背景
决策规则由于其直观可解释的 If-Then 结构,被广泛应用于欺诈预防等金融科技领域至关重要的任务中。标准的决策规则由两部分构成:一系列条件和预测值。 条件是由特征、操作符、值构成的三元组结构,例如 age<50。当规则中的所有条件都被满足时,规则会输出预测值。
目前大多数现有的规则挖掘系统都是以端到端形式运行的,即给定训练集后,专家设定规则挖掘算法的优化指标和超参数,然后等待算法运行结束就可以获得一组规则。在这种方式下,设置超参数和优化指标是融入专家领域知识的唯一途径,一旦规则挖掘过程开始,专家就没有其他方法能够干预规则的生成。但是在如风控这种对抗性的场景中,由于作案手法的频繁变化,训练数据里并不总会包含足够的信息给算法自动挖掘出优质的规则。在这种情况下