阿里巴巴国际交易技术资深总监龚义涛:商业规则应灵活配置

摘要:【CSDN现场报道】2010年12月9日,年度收官技术盛宴SD2.0大会在上海光大会展中心国际大酒店隆重开幕。这是自2007年成功举办首届以来,由CSDN和《程序员》杂志主办的连续第四届SD2.0(软件开发

【CSDN现场报道】2010年12月9日,年度收官技术盛宴SD2.0大会在上海光大会展中心国际大酒店隆重开幕。这是自2007年成功举办首届以来,由CSDN和《程序员》杂志主办的连续第四届SD2.0(软件开发2.0)大会。来自IBM、微软、盛大、FaceBook、阿里巴巴等众多企业的技术领袖全部汇聚,共同剖析当前IT技术发展大势,分享在各自领域的技术成就与成功秘诀。

阿里巴巴国际交易技术资深总监龚义涛,在大会现场做题为《跨国电子商务平台的反欺诈系统》的主题演讲。

阿里巴巴国际交易技术资深总监龚义涛做大会演讲

以下是演讲实录:

龚义涛:我们阿里巴巴跨国电子商务平台有很多跟反欺诈有关系的,比如你帐户被别人盗用,或者你的商品侵权了,我们是从中国向国外出口的,我们侵权的管制比国内要严格很多,因为阿里巴巴大公司法律是非常严格的,所以侵权的产品的审核等等,有很多方面,今天我重点讲的是信用卡的欺诈,就是都是国外的买家,他用信用卡支付,这个信用卡有可能是偷的,我们怎么知道它是偷的。我先放个片子给大家看一下。

其实刚才那个视频有很多东西值得我们思考,第一个我们中国现在是最大的制造国,但是我们在整个产业链中属于下游,大家也都知道,我们只能制造,我们没有参与产品设计,没有参与流通,没有参与售后服务,这一切我们没有参与最后导致的结果就是我们的企业是没有定价权的,国外的企业定价就是你能够生存下去的,朱先生就是这样的,以前做OEM,运的两个货柜赚的钱还不如他四个船做的钱多,类似的平台就是帮助我们的企业能够更深入的整合到这个产业链里面,朱先生就参与到了产品设计,有一个富人是20万的游艇,他说要照一模一样做一个模型,他参与设计,他直接参与销售,流通,所以说这个产业链的整合,另外其实在模式上,我们阿里巴巴把它叫做CBBC,也可以通过朱先生的例子体会到,第一个C就是现在你到超市里面,你能买到商店里面有的东西,但是以后随着互联网的提高,我们要做消费者要的东西,你要这个船我再做,这是第一个C,我们通过互联网,不管是淘宝,还是阿里巴巴,把国内国外的需求拿到,第二个B就是我们的制造商,第三个字词的B就是参与流通的,最后再返回到C,这样打通之后就盘活了,这是刚才另外一个例子的表现,现在大部分的出口有很多环节,从制造商到出口商,进口商,到美国要进口,批发再到零售,你可能一百块钱的耐克鞋子你可能只赚一块钱,没有定价权。

全球速卖通就是缩短了这个过程,我们可能从制造商到国外的一个零售商,就可以进入终端。第一你中国的企业你的利润更大了,比刚才那个裤子多一块钱,最终的消费者也有实惠了,价格也更低了,就是速卖通这样的平台出现,就是使商业产业链更加有效。实际上进出口这个行业在全世界已经有几百年的历史,但是效率是非常低的,信息是非常不对对称的,但是进出口是万亿美金计算的,都是以很原始的方式进行,我们可以让全世界的消费者享受到实惠。

我再通过我们阿里巴巴今年第一次在海外的两次收购来解释一下CBBC是什么意思?像朱先生这样的企业就可以在无缝的中间为更多的消费者带来好处。 当然我们这两家企业是为卖家在多个渠道服务,包括ebay,有独立的店铺,还有Amazon。这个全球速卖通我们去年9月9号上线,今年4月份正式上线,要做这样一个事情,你相当于把淘宝,支付宝都要做进去,要能够进行支付,交易,物流。所以麻雀虽小五脏具全,我们这个速卖通是针对公司对公司的一个批发这样的平台,他们的支付方式可能很多,有可能先付定金,多次支付,还有一个第三方渠道商介入,还有分润的问题,等等,也许运费是由服务商提供的,所以这个定单的执行过程是非常复杂的,有多种方式,所以我们要把这个模块分出来,意思我们可以很灵活的支持各种不同的业务方式出现,这有一些基础服务,比较重要的就是风险控制,这个我今天会讲,还有一个支付,再一个就是物流,在这个之上我们有用户体系,另外一个比较特别的,我们虽然这个平台并不是很久,但是我们一开始就要有一个开放的态度,实际上全世界电子商务绝大部分人没有从进货开始的,我们现在就要把进货这一步要加入到国外的各个电子商务的,不管是服务商,还是平台,还是它的活动里面,所以我们就要在速卖通这个平台里面,你要进货,你可以通过我们的开放平台,不管是产品查询,或是定单,或者定单的功能,这些功能放到你的平台里,以后也可能放到易贝里面,就是把我们速卖通功能通过我们的开放平台植入到不同的地方。

我先讲讲支付,这个跟我今天讲的风控有关系的,我们做国际交易平台,这个支付是至关重要,可能大家听说过类似的公司,他们普遍的做法把支付依托给第三方的公司,我是非常理解为什么这样做,因为你如果要做支付,你必须要有反欺诈,你如果没有反欺诈,你整个利润要被欺诈分子拿走,但是这个反欺诈又是非常难做的,我们去年9月份上线的时候,我们意识到必须要做自主的支付,必须要做自主的反欺诈系统,所以这两个是相关联的,支付系统就是负责资金流,你这个支付系统你用户很方便的可以用,要支付成功率,支付成功率是什么样,速卖通还是小额批发,就是一万美金以下,当然这个一万美金到明年我们是可以突破的,因为我们是一种担保支付,构造我们平台承担一定的风险,这个风险我们能够更好的管理之后,也许一万可以到十万,因为阿里巴巴做进出口的信息平台做了十几年,平均出口的单子是十万美金以下,七八万美金。我们现在一万美金是一个上限,支付成功率就是我买了八千美金,我要支付这个东西,但是现在由于各种原因支付不成功,也许是信用卡公司觉得你有问题,或者你余额不对,或者你被怀疑可能是一个盗卡等等。所以国际支付系统我们必须要做,现在我们一年多来,我们提供了多种的支付方式,就是方便这个,因为全世界的人支付方式不一样,北美的人可能信用卡用的比较多一点,欧洲人可以用借记卡多一点,我们可能通过欧洲这个公司,银行转帐我们也是其中之一,这是我们现在支持的支付方式。还有不同的货币种类,我们还要通过货币转换支付给中国的卖家。我们有了这样一个市场可以支付。有了商业就有欺诈,这个是永远共存的,永远也不会消失的。美国的信用卡盗卡差不多在2%,所以上百亿的产业,这么大的一个产业就意味着什么呢?我给大家看几个图,这种欺诈分子他在全世界都有分布,中国也有分布,排名第五。在美国不同的州,可能沿海多一点,这是电子商务里面欺诈案件比较多的。这个意思是什么呢?现在国际支付方面的欺诈是一个国际化的,集团化的,而且是专业化的组织,因为是利益,我看这个钱赚的也许不比毒品要难,而且要抓住这个人很困难,抓起来惩罚比毒品还低一点,不会枪毙,分工也是专业分工的,有些人负责盗信用卡,花旗银行的信用卡有50万个被偷的,有人去拿信用卡,有人可能到Amazon这样的平台买东西,有人分帐,100块买了它,这个人到易贝30块钱卖掉,这个组织是非常严密的,它肯定有很多数学在里面,我们只能专业的人士对专业的人士了。

就像我刚才说的,我们要做海外的支付必须要做反欺诈,否则平均2%,你什么都不做可能4%被拿走了,平台的利润很薄的,你只能做一笔亏一笔,如果这个平台上面骗子很多,你这个平台有没有信誉了,别人就不会来了。进出口这个行业是数以万亿计的,中国出口到国外一年是28000亿,所以可以想象,速卖通一百亿的交易额并不是一个很远的事情,这个1%是漏检率,如果1%的骗子从你眼皮底下过去没有抓到他,对我们来说就是一亿美金的损失,我们能防止住一亿就是做的非常好了,全世界不管是谷歌,能做到1%是非常困难的,平均是2%,这个1%是做生意的一个成本,这跟用户习惯有关系,我们国内可以安装控件,国外的用户不愿意装控件,反欺诈的难度就加大了,没有控件你索取不到信息,我们只能从用户的行为上进行分析,就是用户的方便性,绝大多数是好人他要求很方便使用,用户的方便性对我们反欺诈带来很大的难度,他很方便,信用卡输入进去就要支付,因为98%的人都是好人。要做这样一个反欺诈系统有两个很重要的指标,一个就是准确度,我刚才讲了漏检率,你有多少真正的欺诈分子从你这里漏掉,什么意思呢?如果信用卡,你是住在纽约,别人把你的信用卡偷去用了,你买了两千块钱的东西,你月底收到帐单,你说这不是我买的,因为国外的消费保护是非常完备的,信用卡就把这个赔给你,然后找我们这个平台,那个人已经跑掉了,这叫漏检,还有错检,你不能说我宁可错杀一千不放过一个,那用户体验又是问题,所以漏检和错检是我们精确度的要求。另外性能,因为我们网上实时的交易,你愿意等多少,一般人两秒钟吧!你就只愿意等两秒钟,其实反欺诈的系统只能给我们500毫秒,因为后面还要做这事情,你必须在500毫秒之内决定这个人是好人,是坏人,如果是坏人把它杀掉,这是性能问题,为什么性能很重要呢?500毫秒不是那么特别了不起,你真正分析他的行为要很多历史数据,你把他30天,90天的数据翻出来,而且要计算他的速度,他在3分钟,5分钟,他一天购买行为有多少变化,这个人他使用电脑移动范围有多大,我们都要计算出来,这个量就大了,所有的计算,当然我们有些可以事先做的,所有的信息必须在500毫秒之内回来,这是关键点。

这是几个主要的技术挑战,一个我们要区别这个信用卡是偷的,还是不是偷的,我刚才说通过用户的行为,什么样的行为?比如你购买的历史,你购买的变化,你购买的地点,但是我们用的特征是几百个的特征,我们有几百个特征,这种系统不可能用完全用人工规则,,这种规则第一很难维护,第二互相冲突,我们必须有一个自适应的学习平台,我下面专门讲一下,我们是怎么样学习的,因为几百个纬度。学习之后就是我们风控的模型,这个模型一定要非常准确,我刚才说漏检率世界标准是1%,我们现在已经有接近这个世界标准了,另外你的错检率又不能太多了。灵活可配置的模型引擎,我们这个模型随着骗子行为的变化我们要快速上线,举个例子,如果圣诞节促销,你有促销活动给他一个折扣券,这个折扣券有漏洞,他写了一个程序,他也不用买,直接放到易贝上面,有人愿意买,他再去里面扣除,一个赚十万块钱他写个程序一分钟多少钱,我们得马上做一个程序把这个掐住,这是一个例子,你要有快速反应,骗子在很多方面高于你的,我们要快速反应,我们不可能预测到所有的方案,水涨船高,很多时候他比你高,你必须有很快的反应,所以我们这个模型要快速上线,同时由于我们有很多模型,我们商业规则可能应用到同一个模型有不同的版本,都同时存在,所以要比较能够灵活的配置,我马上配置一个商业规则把他过滤出去。

这是我们要做一个反欺诈系统这样一些技术关键,这绝对不是那么容易做的,所以很多公司是依赖于第三方的,也是可以理解的。这个就像我刚才说的,这个工作是不能停顿的,因为是不断上升的。你知道它的IP,他反正随便搞个假IP,我现在不方便透露,我们有办法知道你真正在哪里?就跟GPS一样,我们网络上就跟装了GPS一样,不管怎样我们都知道你在哪里。这也是学习的过程,比如真假人民币,这是一根线。但是这个特性比较多了呢?也许这是一个很弯弯曲曲的线。再举一个例子,比如水和冰,你可以通过纬度区别,气压和温度,如果你不知道水的物理特性,你通过不断的做实验可以把这个曲线画出来,二纬的,我们这样的反欺诈是几百纬的,多纬的空间。通过二围的图像你可以想象几百围的分裂器是怎么样工作的,这是一个机器学习一个简单的过程。

第一我们要搜集到数据,很多是历史数据,一般信用卡给你两到三个月的时间投诉,我们最迟三个月之内这个卡是不是盗的,这个历史数据我们是有的,我们要把这些数据拿到,刚才我们说的几百维的特性,几百维有些是延伸出来的,可能通过他几次的购买把他的加速度算出来,或者你移动,第二次登陆时间距离你第一次登陆几百公里。而且这个模型是不断的,每天有新的数据进来,我们这个学习过程是不断的提高,通过这样一个,我们现在基本上有三中机器学习的方法,一个就是贝叶斯的,比如一个产品是一个侵权的产品,我们基本上知道你这个产品是什么特征,因为我们的产品几十万,有些人工可以看得出来,我们原来也有一些系统,如果你错杀了大家就找你,如果不找你就是侵权的,我们通过贝叶斯这个概念很快能算出来,如果你是侵权的产品有可能文本是什么特征。还有决策树,六百个特征,七百个特征,用哪些特征先做出决定再一层一层往下分。最后要做出一个分类器,这个是可以在线做的,这个就在实时里面,数据进来,你点了,坐在那儿等着,我们必须在500毫秒之内我们这个系统要做出判断,根据人工审核的能力我们划一个线,但是这个分之上当时就毙掉,多少分之内我们留下,多少分以上的我们就放过。

这个基本上也是我刚才讲的一个总结,行为有哪些行为方式,比如你注册,注册的时候,或者你敲电脑的速度都是行为,你是一个Robot在敲机器,还有登陆的情况,我经常出差,我经常在中国买东西,因为我的信用卡在美国,我经常打电话给花旗银行,你给我一个绿灯,我昨天中午从美国回来,我现在去买可能就被锁死了,有一个人联合国的,他到处飞,没有办法,规则对他已经没有用了,他肯定是嫌疑分子。你把别人的帐户盗窃了,你肯定要改变联系方法吧!还有一个欺诈的人,可能开了一百个帐户,但是最后你收货,你到一个百个地方收很麻烦的,可能一两个地方,但是他不会写那个地址写的一模一样,我们通过文本分析,你写的这两个地址实际上就是一个地址,货品销赃才能把钱拿到,我们不管语言的,不管是法语,还是英语,我们的文本分析是通过以前的案例来进行分析的。还有买卖互相勾结,现在这个问题比较少一点,因为我们卖家都是在中国,但是我们开放国外的卖家,买卖勾结进行洗钱这个问题,就是很严重的问题,因为这个我们必须要遵守,因为我们在国外做生意必须遵守美国,或者欧盟他的一些法律,可能你如果买卖都是同一个人,或者同一个人控制的人,他要进行交易,他要洗钱,这也有一定的特征。

我们阿里巴巴在全球有不同的人才,我们跟阿里巴巴美国研究院进行合作,才能做成这个系统,我们这个团队也有以前易贝,谷歌里面的人,我们这个系统领先于业界的系统,另外我们跟业界另外一个,可能最领先的公司,我们有实时的数据进行比较。

性能上面我稍微讲一下,一个就是可线性扩展,人多了,交易量大了,可以加机器,另外有一些历史数据,比如以前的历史,全部在500毫秒内算可能算不了,我们会采用提前运算的办法,另外数据库查询到磁盘里面弄可能来不及,我们会用搜索引擎和内存数据库等方案,同时我们对这些指标,比如说很多计算的模块,不同的指标如果超过多少东西,我们的系统会报警的,这也是我们对性能进行监控,从而知道问题在哪里,从而进行提高的一个办法。

我们这个分析就到这里,大家有没有什么问题,我可以回答一下。

提问:不好意思,我问一个小细节,您刚才提到了用户,不管他实际在哪儿,他换地方也知道用户的位置,是不是跟他的帐号有关系?他用别的帐号再注册呢?

龚义涛:跟帐号没关系,欺诈分子会用很多帐户,他的IP也是假的,看不出来,但是他有些物理特性,他通过网络传输等等,我们从这方面分析。

提问:这一块误判率很高的,这可能是比较具体的细节了,这是对抗性非常强的一个工作。

龚义涛:定位这个东西全世界也就两三家。

提问:泛泛的说这一块工作是对抗性非常强的工作,应该说它是矛和盾的关系,您能一直保持1%的指标吗?

龚义涛:这个我们必须不断的工作,我们如果坐在那里不工作就不能保持。

提问:或者你可以把所有可疑的杀掉。

龚义涛:这用户体验就没有了。

提问:您把握的平衡点在什么地方?

龚义涛:这就是人工审核,我们不可能有这么大的人工审核,人工也是一个模型,他基本上半小时之内就会做出决策,我们有一个投入产出,我们是搞一百人,还是两百人,这也是我们需要决策的一个问题,怎么样把人脑,这个系统人脑也是一个模型。人是其中一个因素,人会帮助我这个系统提高。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值