大数据风控的场景化趋势——人人信
时间:2016-06-21 11:39:46 来源:中华网
1. 兴起之初,风控滞后
2013年互联网金融兴起伊始,P-2P、小贷等非银类金融机构多是作为传统金融的补充,起到毛细血管的作用,让金融的血液覆盖到小微企业主和个人。起初的产品形态和审批流程也多是线下产品的线上化,只是额度更低、限制条件更宽松、期限和还款方式更灵活。但是在风控环节却并没有发展出更行之有效的手段,仍是延续银行的做法:以央行征信报告为主要数据源,以专家经验或专家规则为评判策略。同时再加上在内控等管理执行层面上远没有银行规范,因此最终导致行业总体的逾期率和坏账率远超银行。市场先行,风控滞后,风控成为影响互联网金融发展的瓶颈。
2. 数据入场,创新乏力
2015年初,央行释放出了个人征信市场化的信号,一些直接或间接掌握数据源的公司纷纷成立征信子公司。经过一年多的筛选和验证,“大数据”开始逐渐被互联网金融行业的风控人员所接受,有几类数据被证实可以做为征信报告的有效补充,比如:移动设备信息用于识别身份冒用,黑名单灰名单用于识别多头负债,位置信息用于评估稳定性,页面行为分析用于识别欺诈,消费记录用于评估可支配收入水平,社交关系用于评估信用行为等。
在此阶段,各个征信公司提供的 “大数据风控”产品仍停留在较为初级的“数据”层面,信用评分等深加工产品并未得到金融机构的广泛认可。数据本质上是一种资源,这类征信公司间的竞争是资源的竞争。有些征信公司掌控 、有效的数据资源,坐拥市场。另外一些征信公司虽然利用先发优势,打通了上下游生态链,但却很容易被上游数据源绕过,岌岌可危。新兴市场在一定程度上会遵从发展规律,往往会从最初的粗矿型资源竞争转换为精细化的技术水平或管理水平上的竞争。
大数据的内涵远不止是数据资源,在互联网金融领域仍有很大的挖掘空间,在管理上它是一种商业思维的拓展,在技术上它是一种科研范式的创新。大数据除了数据量大之外,更强调数据的完备性、异构性、弱相关,复杂的规律隐藏在长尾的弱变量及其相互的关联关系之中。而线性模型虽然表达能力有限,且受制于多重共线性的制约,但是现阶段依然是风控建模的主流技术,稍大规模的互联网金融机构更倾向于引入传统金融机构中有评分卡建模经验的专家,然后将大数据的新酒装进过去经过十几年打磨的小数据建模方法论的旧瓶子里。
3. 风控场景化,技术需深耕
2016年消费金融爆发,场景的巨大差别导致对风控要求的巨大差别。有些场景几乎重新定义了风控,对审批实时性和策略调整及时性要求高、对风控成本敏感,对准确率却可以适度放松。这对小微规模的消费金融公司来讲无论在风控团队的搭建还是在IT系统的开发上都是一种考验。这种情况下对征信公司而言,一方面,未做深加工的数据客户不能处理;另一方面,通用评分仍不能满足其个性化需求。风控场景化的趋势将迫使一部分征信公司回归征信的技术本源。笔者相信:金融产品虽有很大程度的商业属性,但征信本质上还是技术属性,而且征信技术不会永远停留在浅层的数据层面。一些关键技术的突破可能加速征信公司市场地位的形成,比如:如何为长尾的小微型金融公司提供低成本一站式的风控解决方案并持续快速响应业务变化?如何在小样本的监督下,通过迁移学习增强已有模型的场景泛化能力?如何利用图数据库技术,提高欺诈识别的覆盖度和系统查询效率?如何使用区块链技术促进数据源的互联互通?如何使得已有的基础模型具备在线学习能力?
现阶段的征信市场也许仍谈不上高深的人工智能技术,数据源的打通、整合仍会持续一段时间,但数据源的差异一定会一步步的抹平,这一阶段的速度仍难以预期,可能三五年,也可能更快。届时,金融公司回归商业模式,数据公司回归资源整合,征信公司回归技术品牌,或许这三类公司间的界线会变得模糊,有些公司具备多种身份,但场景化的风控技术经验必将会成为征信公司的核心竞争力。笔者所在的人人信就是在这种思路下面向消费金融公司提供“风控+”服务,即:风控咨询+数据整合+场景获客+资金渠道。
投稿:chuanbeiol@163.com
点击展开全文