专访大数据专家曲冠知:大数据技术与互联网金融的融合

  曲冠知,大数据分析与中小企业及个人贷款金融风险分析专家。多年从事网络大数据分析,流程数据分析与决策支持,银行客户大数据化运营、...

\

  曲冠知,大数据分析与中小企业及个人贷款金融风险分析专家。多年从事网络大数据分析,流程数据分析与决策支持,银行客户大数据化运营、利用大数据防控贷款风险及贷款成本利润决策分析等金融领域的工作。2004年毕业于西北工业大学,获软件工程学士学位。2012年毕业于东北财经大学,获工商管理硕士学位,是国内最早使用大数据算法开展贷款风险管理及成本利润决策分析的大数据专家。先后担任过华为公司驻欧洲代表处高级网络数据分析专家、美国惠普公司高级数据流程专家、中信银行高级数据运营分析专家、拉卡拉金融集团高级数据分析专家等职位,主导过华为欧洲网络大数据联调项目,惠普亚太供应链数据优化项目,中信银行高端客户数据化运营项目,拉卡拉金融大数据贷款风险管理及成本利润分析项目,ABS融资项目,反洗钱数据评审,北京市三通工程数据评审等多个全国及地方大型项目。致力于利用大数据技术改造现代银行和金融公司的业务流程,降低风险管理成本,提升风险防控水平,完善利润成本控制模型。目前主要负责贷款系统、大数据平台运营系统以及大数据分析系统的规划、研发及运营管理,在流程优化、贷款风险管理及成本利润决策分析、大数据处理等领域有丰富的经验,并著有《互联网金融的大数据风控》一书。

  Q:请您介绍您的职业历程 - 在华为、惠普、中信银行、拉卡拉金融集团等知名企业和金融机构的工作经历为您带来什么影响和感悟?

  曲冠知:如果要对这些年的工作经验用一个词来总结,那就是“感谢”,无论是华为、惠普、中信银行还是拉卡拉金融集团都提供了非常广阔的平台。我非常有幸的见证了大数据技术在各行各业中的积极应用。我目前从事的工作聚焦于大数据在金融行业尤其是互联网金融行业中的应用。这几年,随着互联网金融蓬勃发展,我见证了大数据和互联网金融的紧密融合,以及大数据如何在互联网金融防范风险,理清运营思路,细化利润成本,协助分析决策等方面发挥的巨大作用。从我个人的职业历程来讲,主要经历了两个阶段:

  第一阶段是2004年到2012年在华为公司以及惠普公司的职业经历,我作为项目的主导者带领团队完成了华为欧洲网络大数据联调项目,构建了远程网络分析平台,使工程师可以进行远程数据分析和业务调错,为客户提供了圆满的体系支撑,尤其欧洲Vodafone,对此评价非常高,2007年,华为被Vodafone授予“2007杰出表现奖”,而我本人也非常荣幸能够作为团队的主导者支持欧洲Vodafone的业务发展。在惠普期间,作为高级数据流程专家,参与GBS中心在全球供应链中进行业务流自动分配耦合处理系统升级,并获成功,整体流程运行效率提高40%,客户满意度提升50%。

  第二阶段是2013年至今在中信银行与拉卡拉金融集团的从业经历。2013年我作为高级数据专家参与中信银行“天罗地网”项目,与行内同事一起使用大数据对客户进行了精准画像并进行精准营销,数据建模,并在风险控制,反欺诈等方面取得了重大突破,也算开启了银行使用大数据进行精准营销的先河。凭借该项目中信银行荣获《亚洲银行家》年度中国最佳客户关系管理、数据分析项目大奖;在拉卡拉金融集团,作为高级数据专家参与金融集团的风险系统搭建,在全国范围内首次将贷款和信用卡双客户系统统一,并在风险管理、合规、反欺诈、反洗钱等方面均取得了卓有成效的成绩,同时作为业内首家使用大数据进行成本利润决策分析的互联网金融机构,在该领域也取得了积极的探索和成果。

  Q:刚才您提到的天罗地网项目,该项目得到了业界的认可,并荣获《亚洲银行家》年度中国最佳客户关系管理、数据分析项目大奖,能否可以简单谈一下这个项目以及其带来的影响?

  曲冠知:好的。一直以来,我国商业银行对于客户数据的分析还停留在客户的静态信息,主要是单维度的考察客户的职业,收入水平等传统信息,这些信息已经不能满足日益复杂的风险形势和客户体验的需要。正是由于客户属性的日益多样化,以及大数据技术日新月异,对于客户动态信息的分析迫在眉睫,如何快速准确的定位客户信息,如何精准的进行客户画像,如何通过客户多样化信息进行风险防控,如何通过客户画像进行精准营销,这些是金融业普遍面临的难题。当然难题和机遇是并存的,只有抓住问题本质,就能在大数据的浪潮中做出卓越的成绩,同时,使用大数据精准分析客户动态化信息也是金融业发展的趋势。

  这个项目于2013年启动上线,通过整合行内数据信息,整合线上线下资源,突破数据的表层信息,把互联网、大数据、O2O模式和信用卡业务有机结合起来,有效利用银行客户数据信息,深度挖掘数据价值,并推动新客户引入、存量客户经营、风险管理、信贷审批、客户服务等业务模式的优化和创新。上线以来,客户风险度明显降低,客户精准营销准确,这是全国同业首家第三代大数据仓库技术的成功案例,在促进金融风险防范和客户精准营销方面迈出了关键一步,并获得业界的一致好评,并因此荣获《亚洲银行家》年度中国最佳客户关系管理及数据分析项目大奖。

  Q:您认为现在比较主流的大数据技术有哪些?结合您多年金融大数据从业经验,具体到金融业哪种比较好?

  曲冠知:从我多年金融大数据分析的经验中可以看到,金融公司利用大数据技术可以获取不同场景下客户的行为轨迹,从而准确判断贷款者的风险水平,甚至可以提前判断贷款者的还款意愿和现金流状况,所以大数据技术以及其带来的衍生数据,模型等都是金融公司抵御风险的利器;另一个方面,大数据也是中小微企业及个人实实在在的“实际资产”,在金融行业有效提升风险防控水平的同时,让金融更加普惠,让优质的中小微企业和个人更容易获得贷款。金融企业不仅可以使用大数据技术准确判断贷款者的信用风险,还可以帮助企业自身进行流动性风险分析,从海量数据中提前感知融资冬天,提早准备。

  以前,利润计算更多属于财务方面的范畴,随着金融企业的业务越来越复杂,金融企业不得不依靠大数据技术评估其未来可期的利润情况,这其中包括计算资金成本,坏账成本,应收利息,毛利以及利润的分析,并可以将利润分析切分到产品和账户级别,这有助于金融企业快速迭代,不仅可以在短时间内放弃盈利能力差的产品,还可以根据账户级别的分类获得利润率高的客群信息,大数据技术正在全方位的改变企业经营的战略和思路。

  目前主流大数据技术总体上可以分为两类:一类是针对非实时批处理业务需求,重点在于数据量的处理上,传统数据处理能力无法胜任的TB级,PB级海量数据存储、加工、分析、应用等。目前比较主流的技术有:HDFS、MapReduce、Hive等。另一类是针对实时处理业务需求,比较主流的支撑技术为HBase、Kafka、Storm等。从我个人角度看,在金融行业中,两种技术都有用武之地。基于HDFS等技术的特点,可以用它来存储金融业的离线数据,对非结构化数据进行统一存放管理,提供HDFS文件系统,提供数据的多副本备份存储管理,并开发相应的算法对这些数据进行挖掘分析,提高银行企业对历史数据的利用价值。HBase是一种Key/Value系统,它运行在HDFS之上,非常适合用来进行大数据的实时查询,进行消息、金融风险水平和客户需求等的即时响应。金融业需要积极使用大数据技术,将大数据和自有系统无缝衔接起来。搭建高性能、稳定的大数据支撑平台,包含数据收集存储、分析计算以及数据服务功能,这样才能同时满足实时和海量数据之间的平衡关系。

  Q:大数据技术正在成为新金融时代的一把利器,不少金融公司也在积极应用大数据技术,但每个公司的技术水平不同,您深耕大数据技术多年,作为该领域的先行者和杰出贡献专家,针对金融业在开展大数据技术融合和业务建设上您有何建议?

  曲冠知:针对当下大数据技术的日益盛行,计算机协会也在针对全球相关行业背景进行调研究,作为协会的高级会员,也正在积极参与相关研究,期望可以推出一些具有指导性的意见和方案。作为金融机构,应当构建统一的数据管理体系。打破部门、机构、区域及不同产品之间的数据信息分散管理模式,梳理各部门职责和数据资源,形成高效合作、资源共享的运营机制,及时启动统一数据服务平台规划,统一设计数据模型,开展基础数据平台建设,实现明细数据整合和逻辑大集中。同时,建立健全数据联防和数据共享机制。监管部门、行业协会、市场参与主体要形成合力,打破行业间、机构间、地区间数据壁垒,打造数据共享生态圈,提升全行业大数据利用水平。各机构在数据使用能力、业务规模、服务水平等方面存在明显差异,应当依据大数据技术应用水平等因素实施分级分类管理,及相关监管工作机制,提升资源配置的科学性和监管效率,使各类金融企业充分融入到大数据共享生态圈中。