AI助力金融风控降本增效

2023-03-06 19:04发布

“弱”人工智能时代为何金融机构的风控需求更加强烈?传统金融企业与内部运营场景如何通过人工智能技术提升运营效率?欺诈攻击的演变呈何种趋势?有哪些新兴场景?金融科技创新对风控模式有何影响?


5月21日,DataVisor维择科技首席咨询官孙睿做客“金融科技在线大讲堂”,就上述问题带来分享。本期活动由清华大学金融科技研究院证券科技研究中心主办,未央网联合主办。以下整理自嘉宾分享实录:



欺诈攻击的演变趋势和新兴场景

1. 数字化转型中欺诈攻击的演变


随着互联网技术应用的发展,金融科技的创新使场景更加多元化,同时也使欺诈攻击手法更加多样化。以传统银行为例,线下渠道中欺诈特点主要是单点突破,比如线下欺诈申请、欺诈转账交易、伪卡交易以及POS套现交易等以个案为主的欺诈行为。在银行数字化转型中,将更多的业务搬到了线上,欺诈特点进而转向多点爆发,主要欺诈类型可以分为申请类欺诈、行为类欺诈、交易类欺诈及营销类欺诈四种,包括虚假信息包装(黑产)、获客流量作弊、账户盗用、专门套现App、App虚假注册、App异常登陆、恶意薅羊毛、批量机器登录等层出不穷的诈骗手段。


欺诈的攻击模式也发生了相应的转变,由单一的个体攻击向团伙攻击发展,进而形成了协同组织攻击,由专人负责情报收集、漏洞扫描工作,通过技术破解实现变现套利。因此,我们更要关注全生命周期、全流程的反欺诈管控要求。


2. 随移动互联网技术应用产生的风控挑战


随着移动互联网技术的发展,单一功能网站转型多功能平台发展的同时,线上交易行为可能会受到来自多方的有组织攻击,比如撞库、盗号、薅羊毛、虚假粉丝、虚假好友、虚拟货币、洗钱、交易欺诈、钓鱼攻击等。欺诈手法多变,甚至出现多环节联动的情况,多数欺诈行为还会潜伏较长时间来模拟正常客户的行为,使普通风控系统无法检测出异样行为,风控环节面临着巨大挑战。


3. 黑产产业链与特点


黑产攻击的第一步是进行大规模恶意注册,然后利用群控软件进行同屏传输与批量控制、自动化运行、虚拟定位、一键新机串号设置、定时任务、万能表单输入、手机分组管理、万能脚本/自定义脚本等手段实现套利。另外,技术迭代后为减少成本,黑产利用安卓模拟器可以在PC端模拟任意手机、修改设备参数、多开模拟、虚拟定位,提高其效率减少人力成本,形成了完整的产业链。


黑产与风控人员存在着三个方面的区别。首先是利益驱动方面,黑产的欺诈行为会带来巨大的经济利益同时受巨大利益驱使下会产生罕见的积极性和驱动力,而风控从业人员相对利益奖励远远不足。其次在分工合作方面,黑产已经形成专业、分工明确的产业链,产业交流频繁,对新技术非常敏感且快速学习迭代。而风控在企业中为成本中心,受预算限制,团队规模相对较小且同行技术交流也没有那么频繁。最后,黑产仅需在风控体系中寻找个别漏洞即可大规模复制盈利,实现“一招鲜,吃遍天”的单点突破。而对于防守方来说,风控人员需搭建全面风控管理体系,任何一块防范不到位都会出现明显“木桶效应”。



金融科技创新对风控模式的影响

1. 新技术的应用对金融风控的影响


从增益角度来说,新技术的运用丰富了数据维度,使得客户画像更细致,提高业务处理效率的同时也提升了客户体验,使客户精细化管理真正成为可能,进而形成新的大数据风控模式。


从风险维度来看,业务从线下转向线上,欺诈手法更复杂、更隐蔽、变化更快速。同时,欺诈攻击活动呈现针对性、团伙性、短时集中爆发等特征。因此在风险识别的准确性和处置的时效性上,传统的风控模式较难满足当前的风控业务需求。


2. 有效风险识别是关键


实现合理风险资产组合的关键在于有效识别风险。通过不同组合,利用技术手段找到与企业或者金融机构风险资产相匹配的客群,明确其风险偏好进行主动风险选择进而形成合理的风险安排。风控类似于“猫鼠游戏”,当发现攻击时,风控方通过采集黑样本形成数据标签,再对数据标签进行人工分析产生规则,或者抽取其特征进行训练模型,然后将规则或者模型进行测试,落地生产阻挡攻击。但攻击者在一段时间后察觉到原来的攻击手法被阻拦就会很快变换攻击模式,从而我们就需要重新采集数据形成新的规则或模型,因此我们说欺诈模式是多变的。


3. 风控技术发展历程


第一阶段是黑白名单,单独用于检测样本,因此覆盖率和准确率有限,对于一些有针对性的攻击,比如说设备指纹,黑产就可用虚拟机等逃避检测。


第二阶段是规则引擎。这是目前金融企业使用较多的,需要对欺诈行为有深入了解,也就是收集已有案例形成一些规则来阻拦已经发生过的案例,用人工方法定期调节规则。这就需要大量人工操作,难以跟上最新形势变化。


第三阶段是有监督机器学习。与规则引擎类似,也需要大量人工标注数据来训练检测模型,可用于检测同样行为的攻击,但不能检测未知的欺诈行为,数据时效性不够的问题依然存在。如果公司规模不够大,遇到的欺诈案例较少,那么在当前的风控技术下就难以发现新型欺诈行为。


第四阶段是无监督机器学习。这种技术会自动挖掘和检测各种已知、未知的欺诈行为。自动产生标签,用于机器训练、模型检测,或者自动产生规则,免除费时的人工规则调试。在实践中可以应对快速变化的欺诈,并对上述的风控方法进行较好的补充。通过无监督机器学习的欺诈群组检测是从全局角度出发,在高维特征空间分析用户之间的关联,自动挖掘异常团伙。通过“有组织的欺诈活动存在紧密联系,而正常人行为特点相对离散”这一特点,在高维空间自动分析关联维度,无需预先设定阈值即可快速准确地检测出新型欺诈模式。同时利用预测模型进行检测,提前预警、捕捉“潜伏期账号”。通过可解释性的文字表述(即检测原因),展示群组用户之间关联性和关键聚类特征,筛选出特殊群体。此外,无监督机器学习通过超大规模解决方案每天可处理千万级用户和亿级事件。


在实际操作中我们通常将无监督机器学习与其他风控技术相结合。通过规则引擎有监督建模,针对个体欺诈攻击设定欺诈模式规则,让发生过的案例不再发生。同时利用无监督机器学习引擎发现潜在团伙欺诈、捕捉未知欺诈手法,提前预警及时发现,让潜伏的欺诈行为不能发生。



风控解决方案面临的挑战

AI风控解决方案在金融领域的应用需要满足几个条件,首先是要了解反欺诈业务知识体系,其次要有优秀的机器学习模型,最后风控解决方案还需要适用于大数据生产环境的底层架构。


挑战一:风险相关数据的清洗和特征工程


面对海量数据,如何清洗数据从而生成数据特征会直接影响模型效果。我们需要建立关于每个客户的整体视图,综合考量其各方面的数据,刻画出完整的客户数据画像。在特征工程中应用深厚的业务和反欺诈知识,通过客户的肖像信息、行为与活动、数据来源与内容甚至是账户关联性来综合判断客户数据的多重属性。


挑战二:不同客户群的风险识别


在数字化过程中,传统风控模式开始失效,客群结构和业务模式发生变化,客群下沉带来的风险增高,高风险无稳定工作的客户增多,无法获取充足的客户信息。无征信报告记录的客户在线上业务的风控表现欠佳,网上申请贷款、线上交易欺诈以及激烈的市场竞争也会使得金融机构客群下沉。此外,P2P等互联网金融风险传染也增加了风险防控的难度。


挑战三:侦测快速多变的欺诈模式


当前的欺诈攻击手法快速多变,而以往的风控方案以发现个案或单个事件为主,较难发现不同账户之间的欺诈关联。历史标签通常在损失发生后的3-6个月才能生成,历史标签的准确性还会受到确认过程的影响,这些都会影响依赖于标签的模型效果。由此我们认为,无监督机器学习是侦测未知欺诈模式的利器,无需历史标签侦测未知欺诈模式,同时可在损失发生前及时发现潜在欺诈团伙。



全流程金融风控的新思考

从全流程视角把握产品生命周期各环节中的金融风控,我们可以分为五个环节、两个维度来考虑(如上图所示)。在每个环节分别进行有针对性的风控措施,形成金融风控全流程闭环。


在风控解决方案中,通常可以从数据和技术两个维度来看,既有数据类相关产品和基于AI技术开发的系统或工具。在当前数字化的背景下,我们可以看到未来数据的使用和管控将会越来越严格。因此,可以预见的是,将来不同数据使用方可获取的数据信息很可能都差异不大。而与此同时,对于数据挖掘所需要的技术依赖会更大,以前可能被低估的“技术”将迎来更大的用武之地。举个例子,金融企业自有业务流程中数据的价值有待进一步挖掘。当外部数据不可用时,通过对客户行为数据、环境数据的深度挖掘,同样可以发挥有效风控作用。