在《合成数据相对于真实数据的优势》一文当中, 我们着重介绍了合成数据如何应用于计算机视觉模型的训练,在文章当中我们有提到:合成数据的另一大应用场景便是表格数据。在下文中我们将解释如何使用合成数据帮助训练高精度的反金融诈骗模型,以及如何避免使用敏感的个人信息。
注:该文章转载自itprotoday,为了让读者更顺畅地阅读,我们对文章进行了部分修改,如添加了一些插图或改动了一些用词,您可以点击此处查看原文。
银行迫切地需要解决金融诈骗问题,LexisNexis Risk Solutions(一家全球数据和分析公司)的研究发现:由金融诈骗导致的每一美元损失,需要投入相当于损失金额本身的四倍成本来解决问题。
为了防止损失,各大银行已经开始采用AI和机器学习模型来检测诈骗特征,但尽管银行系统每天充斥大量的交易,然而能够用于训练ML模型的诈骗样本却相对较少。这时便体现了合成数据的价值。
什么是合成数据?
合成数据是具有统计学代表性版本的真实数据,合成数据当中不包含任何原始的真实信息,但它保留了统计学特征。简单来说ÿ