在反欺诈领域,如果存在相同或相近地址异常批量进件,则有可能出现了批量欺诈。所以在风险防控中,可以通过计算地址相似程度设置相应规则来防范该情况。基于不同地址相似性原理得出的地址相似程度,可能在值上有差异。本文介绍基于SequenceMathcer计算地址相似性。
一、SequenceMathcer参数详解
SequenceMatcher是Python标准库difflib中的一个类,用于比较两个序列(如字符串或列表)的相似性和差异。
SequenceMatcher(isjunk=None, a='', b='', autojunk=True)
参数详解:
isjunk:可选函数,指定哪些元素在比较时应该忽略。默认为None,即不忽略任何元素。
a=‘’, b=‘’:要比较的两个序列,可以是任何可迭代的对象,最常见的是字符串和列表。
autojunk:布尔值,指定是否自动将某些常见的垃圾元素视为不重要,默认值True。