金融“智变” 中腾信及小花科技自主研发知识图谱并全面应用

  金融行业因其与数据的高度相关性,成为人工智能最先应用的行业之一,知识图谱作为人工智能的核心技术,正在加速进入金融领域,并日益成...

  金融行业因其与数据的高度相关性,成为人工智能最先应用的行业之一,知识图谱作为人工智能的核心技术,正在加速进入金融领域,并日益成为科技金融的基石。近期,中腾信及旗下小花科技自主研发的知识图谱实现关键性技术重构,并在“小花钱包”全面应用。

  数据升级为智慧 知识图谱带给AI风控质的飞跃

  通俗地讲,知识图谱就是把真实世界搭建成一张计算机能够明白的知识网,是人工智能的基础。知识图谱最早由谷歌提出并应用于搜索引擎,结果给行业带来一场由“关键词搜索”到“智能搜索”的革命性升级。知识图谱之于计算机,就好比知识之于人类,赋予了计算机从“关系”的角度去分析问题的逻辑思维能力。

\

  在整个人工智能技术链条中,知识图谱居于核心的地位。知识图谱是金融数据分析从简单的量化模型走向更为复杂的价值判断和风险评估必经的一环。

  知识图谱在金融领域一个典型应用是推荐算法,国内领先的就是蚂蚁金服。在其产品线中,无论是好友推荐、内容推荐还是商品推荐都能找到其用武之地,例如大家熟悉的“集五福”、支付宝好友推荐等。国内一些金融科技领先的银行如招商银行,也将知识图谱应用在营销获客领域,通过对已有的客户信息和关系数据进行分析,识别和开拓与现有客户有关联的优质客户,形成高价值客户营销名单和企业画像。

  知识图谱对于信贷风控环节的价值巨大,尤其是针对借款端风控的贷前反欺诈环节。在当前的反欺诈业务中,团伙欺诈识别仍属于难点,而引入知识图谱技术,能够极大地提高团伙性欺诈识别效率。

  反欺诈的核心是人,而团伙欺诈的核心是人与人之间的关系。知识图谱作为关系的直接表达方式,很好地解决了这个问题;其次,知识图谱本身就是用来表达关系的,这种直观的表示方式可以帮助业务单位更有效地分析复杂关系中存在的特定的潜在风险。

  例如,对于一个传统征信数据缺失甚至空白的新客户,通过传统的风控方法是无法识别失信和欺诈风险的,但是通过知识图谱技术计算客户与各个风险节点的关联关系,可计算与欺诈客户、黑名单客户的关联紧密程度,从而判断风险高低。

  中腾信目前对于知识图谱技术的应用主要着眼于贷前反欺诈环节,小花钱包还增加了在借款环节的应用,作为线上小额借贷App,小花钱包给予具备条件的用户以循环额度,可进行循环借款,在每一次用户借款前,都会结合知识图谱技术进行再一次的风险识别。历经多次迭代,中腾信及小花科技的知识图谱技术在应用上更加自动化、智能化,能够有效识别传统类型的欺诈团伙。

  据了解,中腾信及小花科技在构建反欺诈模型时,要求反欺诈模型不但能应用于离线数据的溯源分析,同时还要支持实时数据的计算。此外,采用了多种经典的社交网络算法,通过反复对比测试,挖掘出一些适合特定场景的优质算法,这些算法在效率和效果上都表现较好,并且能够发现层次性的社区结构。有些算法基于图的半监督学习方法,具有线性的时间复杂度,可以很好地适应大规模社区的检测。值得一提的是,针对实时场景,在现有算法的基础上,进行了二次优化和开发,在秒级以内实现了新节点社区的实时划分,进而实现风险客户快速识别功能。

  业内人士认为,有了知识图谱的人工智能风控系统不再像一个婴儿只能根据眼前的数据简单判断,而是真正开始成长,具备了分析复杂问题的能力,实现了质的飞跃。

  坚持自主研发 突破人工智能核心技术应用

  人工智能在金融领域应用还在探索阶段,目前处于金字塔顶端的是BATJ等巨头,而知识图谱作为人工智能技术核心,更是只有少数机构实现了应用,但这些机构基本是通过第三方技术输出,能够实现自主研发的堪称行业翘楚。此前,阿里巴巴曾将自主研发的知识图谱作为重要科技成果在云栖大会上重磅亮相。

  对从业机构而言,知识图谱应用难,自主研发更难。难点主要体现在三个方面:

  1. 数据建模

  数据建模的难点主要包括如何对知识图谱数据进行自动化构建,从而在数据清洗与数据处理阶段避免大量的人工操作;如何能够大批量自动导入现有结构化知识,并能够对复杂数据进行知识表示。

  2. 知识存储

  知识存储的难点主要存在于存储与推理计算,主要包括大规模三元组数据的存储,知识图谱组织的大规模存储,事件与时态信息的存储,快速推理与图计算的支持。

  3. 知识融合

  知识融合技术的难点主要包括实现不同来源、不同形态数据的融合,海量数据的高效融合,新增知识的实时整合。

  据中腾信技术相关负责人透露,在进行自主研发之前,中腾信和小花科技曾考虑过独立提供该类技术的第三方技术提供商或机构,也接入测试过数个产品,但实验效果不够理想, 且灵活性不够,无法满足反欺诈风控策略的快速调整。部分第三方公司在数据覆盖方面有优势,但是数据的精准度和数据深度上比较有限。

  事实上,中腾信及小花科技作为消费金融科技服务主体,多年来在金融风控领域积累了丰富的历史数据与大数据挖掘经验,完全有实力进行自主研发。目前,针对近百亿级数据进行处理建模及算法优化,中腾信和小花钱包知识图谱技术实现了贷前应用秒级响应;能够支持客群组合管理、额度管理等方面的正面及负面应用;对存量客户实现了多度关联关系识别;基于用户关联关系图谱生成的图特征,提升优化了风险规则及评分模型。自主研发更能够实现数据的精准深度挖掘,更有优势。

  从应用效果来看,中腾信及小花科技自主研发的知识图谱技术,成功突破了人工智能核心技术应用,其经过历史发现的欺诈团伙的验证,可以有效识别传统类型的欺诈团伙,已全面接入风控反欺诈场景,进一步提升了其金融科技实力。

  冲破拥有金融大数据的数据服务商所构建的商业壁垒,在技术层面已经实现。金融科技的市场竞争也正在从“数据”竞争跨向“技术”竞争的新时代。中腾信及小花科技能否凭借自主研发优势“智”领未来,值得期待。