VLDB2023｜方略：一个交互式的规则研发系统

最新推荐文章于 2024-10-16 23:49:24 发布

AI_Infra

最新推荐文章于 2024-10-16 23:49:24 发布

阅读量97

点赞数 1

文章标签：人工智能 ai 开发语言云计算算法程序人生数据结构

本文链接：https://blog.csdn.net/AI_Infra/article/details/131433345

版权

方略是蚂蚁集团构建的交互式规则研发系统，旨在将算法与专家领域知识结合，解决在对抗性场景如风控中高质量规则挖掘的问题。通过Web界面，专家可以实时查看和编辑决策规则，提升规则研发效率和准确性。方略使用Ray进行分布式计算，支持合取范式规则表示，提供实时条件推荐，并强化规则的鲁棒性。已在蚂蚁集团内部和外部金融机构中应用，未来将继续优化推荐算法和评估指标。

摘要由CSDN通过智能技术生成

文｜梁仕威（花名：栖川）

蚂蚁集团算法专家
方略平台技术负责人，专注于分布式计算领域，主要负责蚂蚁基础算法的分布式设计与开发。

本文 3419 字阅读 9 分钟

在类似安全风控这种对抗性的场景中，由于欺诈者作案手法的频繁变化，使得训练数据并不总会包含足够的信息给算法自动挖掘出优质的拦截规则，这种场景下高质量拦截规则的挖掘需要结合专家领域知识。如何将算法和专家领域知识相结合成为了业界一个值得探索的课题。蚂蚁集团 AI Infra 团队针对上述问题，构建了一个交互式的规则研发系统——方略，提供了一种在规则研发过程中高效融入专家领域知识的解决方案。

描述该系统的 Demonstration Paper《Fanglue: An Interactive System for Decision Rule Crafting》近期已经被数据库领域的重要会议 International Conference on Very Large Data Bases （VLDB2023） 所接收。VLDB 是中国计算机学会 （CCF） 推荐的 A 类会议，每年都会吸引国内外各大高校和科技公司的投稿。

1►背景

决策规则由于其直观可解释的 If-Then 结构，被广泛应用于欺诈预防等金融科技领域至关重要的任务中。标准的决策规则由两部分构成：一系列条件和预测值。 条件是由特征、操作符、值构成的三元组结构，例如 age<50。当规则中的所有条件都被满足时，规则会输出预测值。

目前大多数现有的规则挖掘系统都是以端到端形式运行的，即给定训练集后，专家设定规则挖掘算法的优化指标和超参数，然后等待算法运行结束就可以获得一组规则。在这种方式下，设置超参数和优化指标是融入专家领域知识的唯一途径，一旦规则挖掘过程开始，专家就没有其他方法能够干预规则的生成。但是在如风控这种对抗性的场景中，由于作案手法的频繁变化，训练数据里并不总会包含足够的信息给算法自动挖掘出优质的规则。在这种情况下