有问题搜一下~
下载APP
信用卡 > 研究评论 > 媒体

智能性交易欺诈风险评分模型的开发与应用

来源:陈建 小编:我爱卡 2006/09/28
      欺诈是发卡机构面临的一个严峻问题,如2001年美国VISA卡的欺诈损失为4亿美元,美国万事达卡的欺诈损失为3亿美元。2002年美国信用卡行业的欺诈总损失为8亿美元,英国信用卡行业的欺诈总损失为4.25亿英镑(约7.5亿美元) ,2003年和2004年美国信用卡行业的欺诈总损失仍然高达7亿~8亿美元。许多欺诈是有组织的犯罪团伙行为。智能性交易欺诈风险评分模型是发卡机构反欺诈的最重要的武器之一。

      交易欺诈风险评分模型是利用信用卡当前交易信息和历史交易行为模式对比来预测当前交易为欺诈的概率的模型,为智能性反交易欺诈授权策略(Intelligent Anti-fraud Authorization Strategy)提供科学依据,对欺诈风险高的交易可以拒绝授权和展开调查。

      由于交易欺诈的识别具有“大海捞针”的特点,即大量的交易中只有极少部分是欺诈性交易,所以交易欺诈风险评分模型往往使用极精细极复杂的模型技术,主要利用机器学习和神经网络模型(Machine Learning and Neural Networks Model) 技术。这需要极大的样本量,样本个数往往达好几百万个交易。为了最大限度地提炼交易欺诈的行为特征和模式,在美国和英国,银行间往往形成一个数据共享团体(Consortium) ,把各自分散的数据集中在一起,特别是把欺诈的记录集中在一起,让样本的丰富程度最大化,由专业化模型公司开发出能充分抓住行业欺诈性交易特征的预测模型,由各银行付费使用。个别超大型银行和信用卡公司自己的样本量也比较丰富,所以能够由内部科研力量或聘请专业化模型公司发展量身定做的客户化交易欺诈风险评分模型。

 

       预测信息

      交易欺诈风险评分模型所用的预测信息主要是来自实时交易授权(Real-time Transaction Authorization)的信息和历史交易授权信息,在一定程度上使用交易登记信息(Transaction Posting)、付款信息和非货币问询信息(Non Monetary Info and Inquiry)。交易授权和交易登记的区别在于,交易授权是实时地把相关交易信息和授权要求电子传送到银行授权系统并实时地接受银行的授权决策,而交易登记是对一定金额以下的交易无需经过银行授权(By Default Authorization Decision Is to Approve, 即缺省授权决策是批准) ,只需每日汇总后提交银行登记。

      在美国,100%的信用卡交易是实时授权,而在英国,底线限额(Floor Limit)以下的信用卡交易为交易登记。

      常用的预测信息的原始数据元素包括:
      * 信用卡账户号码(用于作公共码键,非用于提炼预测变量)
      * 账户持有人的国家号码和邮政编码
      * 商户号码(Merchant ID)
      * 商户的国家号码、货币代码和邮政编码
      * 交易的日期和时间 * 交易数额 * 交易种类(购物、提现等)
      * 商户种类(Merchant Category Code, 简称MCC or SIC) * 密码核对结果
      * CVV核对结果
      * 信用卡过期日(Expiration Date)
      * 信用额度和可支配剩余额度
      * 信用卡使用途径(键入或刷卡,Keyed or Swiped)

      持卡人每一次用卡交易,都会产生上述数据。通过对持卡人交易历史的跟踪,可以提炼和发现持卡人的行为模式(Behavioral Pattern) 。如果当前的交易与持卡人的历史行为模式差别较大,则欺诈的可能性也较大。因为欺诈者可以盗取信用卡或盗窃卡信息,甚至可以伪造信用卡,但不能完全模仿真实用户的用卡行为模式。而且,欺诈者本身的欺诈用卡行为也往往会表现出一些特征(如密集使用、大额交易、光顾特殊商店等)。所以,通过对当前交易信息和历史交易信息的对比,可以提炼出几百个能够在一定程度上区别欺诈性交易与真实性交易的预测变量,然后利用复杂的神经网络模型,通过机器学习把预测变量信息以函数形式综合在一起,预测每一个交易为欺诈的概率。

       预测变量

      交易欺诈风险评分模型的预测变量的提炼技术(Feature Extraction) 比较复杂,因为它把当前交易和历史上不同时候的许多交易的方方面面的信息进行对比,从而判断当前交易是否与历史交易模式一致。

      简单的预测变量只运用当前交易的信息:
      * 一维性的变量
      △ 交易金额(一般金额高的交易嫌疑较高)
      △ 商户种类(如珠宝店、赌场、高档消费品商场交易的嫌疑较高)
      △ 交易发生地离持卡人家庭住址的距离远近(一般利用商户所在地邮政编码和持卡人家庭住址的邮政编码所对应的经度和纬度来计算距离)
      △ 交易发生的时间(一周7天,每天24小时,共168种可能的值)

      * 二维性的变量(把两种数据元素组合在一起)
      △ 把商户种类和交易金额组合在一起
      △ 把交易发生的时间与距离远近组合在一起等 复杂的预测变量把当前信息与历史信息联系、对比:

      * 以时间为基础的变量
      △ 过去30分钟交易的次数或平均金额
      △ 过去1小时、2小时、3小时、半天、1天、2天、1周等时间段交易的次数或平均金额
      △ 当前交易金额与过去若干时间段的交易金额的均值(Mean)和标准差(Standard Deviation) 的对比等 * 以事件为基础的变量
      △ 过去2次、3次、4次、N次交易的平均金额
      △ 过去2次、3次、4次、N次交易的最大金额
      △ 当前交易与过去若干次交易金额的均值、标准差以及最大值的对比等

      不仅对金额可以提炼以时间为基础或以事件为基础的变量,对于商户种类、交易距离、交易时间、交易种类、交易方式、交易国家、交易货币等信息均可以提炼类似的变量,如过去1天光临珠宝店的次数、过去N次交易地点离家庭住址的距离的均值、最大值、最小值、标准差等。通过这些复杂的变量,可以捕捉到每个持卡人的历史行为模式、当前交易行为与历史行为模式的差距、交易发生的速率和动态等。把这些错综复杂的信息以神经网络模型或其他模型技术综合起来,能够有效地预测欺诈的概率大小。

      需要指出的是,由于交易欺诈风险评分模型的变量提炼需要相当长的交易历史,涉及的交易量极其庞大,每一次交易的数据量又很大,所以,如何有效地保存、清理、加工这些数据成为一个极大的技术挑战。特别是欺诈风险评分往往是在授权系统里实时贯彻的,数据处理的速度和效率可以对授权系统的表现产生一定的影响。

      一般来说,变量的提炼涉及的数据存储有两种方式:一种是把相关的整个交易历史的数据保存起来,精确地按定义来计算变量值。比如,过去10次交易的平均金额。如果把过去10次交易的信息都保留在数据表里,则计算均值是很简单的,即把10次交易额相加再除以10。这种方式的好处是直观、精确,但它要求相当高的数据存储空间(Data Storage Space)和计算能力(CPU)。设想一下,如果要计算过去3年的平均交易额,就意味着需要保存每个账户3年里所有的交易信息并实时计算。这在实践上是十分困难的。折中的办法是只保留一定的交易历史(如3个月) ,这样可以在一定程度上缓解对数据存储和计算能力的挑战,但代价是历史信息不完全。当然,随着数据存储技术的不断进步和计算机功能的不断增强,数据存储空间和计算能力的限制将不断减少。

      另一种方式是把过去的交易信息总结起来,只保留相关的总结性信息,而不保留具体的历史交易信息。比如,为了计算最近10次交易的平均金额,我们并不保留最近10次交易的具体记录,而是把上次的该项均值保留起来,与当前交易的金额进行加权平均。可以数学公式表述如下:

      Xt=aXt-1+bVt

      Xt为当前需要计算的均值,t代表当前,t-1代表上一次,Xt-1为上一次计算并保留下来的变量值,Vt 为当前交易的金额,a和b分别为权重,b的值越大,则当前交易金额对变量值的影响越大。类似地,可以用这种方式来保存必要的总结性信息,而避免了保存完整交易历史信息的技术困难。这种方式的优点是显然的,即对数据存储空间和计算能力的挑战性较低,而且总结性信息以特殊的方式反映了交易历史。这种方式的挑 战性在于,如何确定a和b的权重,显然,如果权重不合理,则变量值的精确度可能会成较大的问题。

      不管以何种方式,在提炼出大量的、具备一定预测力的变量以后,可以通过一定的统计手段来选择合适的变量,组建模型,常用的手段如回归分析、神经网络模型、线性规划等。

       模型实施

      交易欺诈风险评分模型的合理使用主要有三种方式:

      第一种是实时实施(Realtime Scoring)。对当前交易实时地在交易授权系统里计算产生评分,并据此进行授权决策,对高风险的交易拒绝授权或电话核对,并进行调查。这种实施方式的欺诈侦测发现率是最高的,因为它在交易批准以前就可以根据模型确定交易的欺诈风险概率,确定哪些高风险的交易应该拒绝或电话核对,但它对系统的要求也最高,因为必须对大量的交易授权要求在几秒钟内调动模型计算评分并做出决策反馈到销售终端。

      第二种是在线实施(Online Scoring)。对上一次的交易(而不是当前交易) 在交易后进行评分并且在系统中保存起来,用于对当前的交易的授权决策。这种实施方式的欺诈侦测发现率要低一些,因为它总是晚了一拍。如果上一次交易的风险不高,但当前欺诈风险极高,这样的交易仍然会被批准,因为当前交易没有实时产生评分来作为决策依据,依据的是上次交易的评分,当前交易只被用于事后评分而对下次交易产生影响。可以想象,这种实施方式对于一个账户刚刚开始被欺诈使用时的效果比较低。在线实施的好处是对系统的要求较低,因为不必要在交易发生的时候实时地调动模型对大量的交易计算评分并在几秒钟内完成。

      第三种是下线实施(Offline Scoring, 又称批处理实施 (Batch Scoring)。每天只对账户当天的所有交易汇总评分一次,昨天的评分用来作今天的交易授权决策的依据。这种实施方式的欺诈侦测发现率最低,因为它晚了整整一天,而欺诈者在第一天就可以大量欺诈用卡,从而给持卡人带来巨大损失。当然,下线实施对系统的要求也最低。

       反欺诈策略

      在交易欺诈风险评分模型的开发完成后,发卡机构应依据模型制定智能性的反欺诈交易授权策略,即决定在什么样的分数线上应该采取什么样的授权决策:批准、拒绝还是电话核对交易的真实性?在决定相关分数线前,应该先了解每个分数线所对应的欺诈侦测发现率、误差率和成本收益对比关系,模型开发商或内部模型开发小组应该准备这样的管理信息报表作为决策的依据。

      交易欺诈风险评分模型被广泛使用于欧美信用卡行业的智能性反欺诈策略之中,为及时发现欺诈性交易、控制和减少交易欺诈损失发挥了非常重要的作用。 反欺诈策略的目标是最大限度地降低欺诈损失额,而预期欺诈损失额等于欺诈概率乘以交易额。由于欺诈风险评分反映了欺诈的概率,所以,欺诈风险评分和交易额是反欺诈策略的主要决策依据,辅之以商户种类、交易国度、刷卡方式等信息。图1显示了简单化了的智能性反欺诈策略。

      从图1我们可以看到,智能性反交易欺诈策略的核心是通过交易欺诈风险评分来发现那些风险较高的交易,辅之以交易金额等其他信息,从而拒绝或电话核对那些高风险的交易。

      一个好的反欺诈策略应该同时达到三大目标:电话核对和拒绝的交易数量适度,不超过系统和资源的负荷;最大限度地发现和阻止欺诈性交易;最小限度地影响真实的交易。

      除了根据评分对欺诈风险较高的交易做出拒绝或电话核对的决策进行反欺诈以外,银行还可以利用欺诈风险评分来发现可疑的交易,利用事后电话联系、信件联系或电子邮件联系的方式,与持卡人在交易以外进行沟通,核对可疑的交易。如果证实某信用卡账户正在经历欺诈性交易(如持卡人证实某可疑的交易非其所有) ,则立刻拒绝该卡的所有后续交易并给持卡人换发新的信用卡。这些反欺诈措施可以作为对实时反欺诈授权决策有效的补充。要进一步了解这方面的详细内容,可参阅本文作者所著的《信用评分模型的技术与应用》和《现代信用卡管理》。
继续阅读

办卡推荐 更多卡片

更多卡片

贷款推荐更多贷款

更多贷款

相关文章

查看更多