[摘要]随着保险数据规模的急剧增长,如何依靠数据治理策略,有效地降低保险大数据的维护成本,进而充分彰显保险数据的实际价值,已成为保险领域的热门研究话题。本文在对当前保险行业数据系统缺陷分析的基础上,给出了保险大数据环境下的数据治理框架范式。该框架范式包含了针对保险大数据的数据治理、数据监控、数据应用等方面,这对保险领域大数据治理体系的建立有着重要的理论意义和现实价值。在此基础上,进一步分析了人工智能方法在该数据治理框架下的应用前景。
[关键词]大数据;保险领域;数据治理;数据质量;人工智能
随着移动互联网等技术的迅猛发展,绝大多数保险企业都上线投入并运行了与自身管理相关的业务系统,这些线上保险业务系统在辅助保险代理人和后台管理人员工作效率方面都取得了显著的成效。然而,伴随着数据规模的急剧增长,各类不完善数据(如不确定、不精确、冲突、不真实)的存在,使得保险企业对于商业保险数据的有效挖掘和深度分析举步维艰。为此,针对保险大数据的治理理念应运而生。保险企业能够通过数据治理加强数据的管理,提升数据的质量,充分地挖掘保险商业数据的价值[1]。
一、保险大数据治理的框架
伴随着线上线下保险业务的飞速发展,保险企业所搜集的数据普遍存在着各级信息子系统间的数据规范和标准不一致等问题,致使内部管控与监管、外部服务与监控间的协同性问题越来越突出,具体表现在如下几方面:(1)缺乏一致的数据格式,进而导致保险企业系统内部对各渠道获取的数据难以形成一致的表述;(2)各地区保险业务数据本身的真实性、准确性、可靠性等方面无法保障;(3)保险企业自身的数据治理系统不完备,难以实现对时序性保险数据质量的有效监控;(4)商业保险数据本身的隐私性、安全性难以有效保障[2]。为了有效解决这些问题,针对保险大数据的数据治理框架的提出显得尤为迫切。保险大数据的治理系统本身就是一个汇集数据管理、数据质量提升和数据应用为一体的系统。该系统能够通过构建有效的数据管理规范、方法与机制,使保险企业收集的业务数据等依据规范进行存储,并通过相应监控手段进行调整与质量提升,从而最大化程度地实现保险商业数据的价值。正因为数据治理对于保险行业的重要性,2018年5月,银保监会印发了《银行业金融机构数据治理指引的通知》(银保监发〔2018〕22号),从国家层面开启了数据治理的发展新趋势[3]。数据治理的概念越来越受到了国家、行业、企业的多方关注,目前已然成为大数据生态产业中的重要构成因素。本文从实际应用考虑,将大数据治理系统的主要构成绘制于图1所示。从图1中可以看出,保险数据治理本身就是一个系统性问题,为了能够更高效率地取得保险大数据的治理效果,保险数据治理的步骤应当按照四字方针执行,即:管、梳、治、用。其中,“管”对应的是保险数据治理最重要的任务——数据的管理;“梳”是数据的梳理;“治”是对保险数据进行质量与安全性的全面监控;“用”则是最高层级的治理,保险企业挖掘数据本身的价值,将其应用于提升企业效益等等方面[4]。图1数据治理框架
(一)数据管理
数据管理是数据治理的核心功能。通过对数据的管理,包括对原始数据的类型分析,不同渠道获取的数据间关联关系、异质数据的整合与存储、数据计算等等,为实现对保险大数据有效治理提供基础保障。
(二)数据梳理
在数据管理的基础上,需要对系统中数据进行有效梳理。梳理数据的目的在于发挥和提升数据的应用价值。通过标准化的数据梳理,使得保险企业工作人员能够高效且方便地进行数据查找、数据筛选、数据分析,形成规范化的数据字典。
(三)数据监控
数据监控,本质上也可以称之为数据质量的监控,通过设定相应的系统访问权限、存储过程中规范约束控制与处理、系统隐私与漏洞发现等环节,实现对保险数据治理系统的实时监控[5]。其目的在于维护数据治理系统的稳定与安全,确保系统数据的规范性、准确性、安全性等。
(四)数据应用
数据应用环节,其实是数据治理下数据质量的验证环节,也可以看成是数据治理之后数据价值的有效体现途径。数据应用给保险企业带来的具体效益表现在:(1)使得杂乱无章的原始数据规范化、可视化以及规律化,便于企业管理人员统计分析,提升工作人员工作效率;(2)使得数据挖掘能够有效推进,促进保险企业高效发现潜在的市场;(3)人工智能算法能够在数据治理的框架下发挥更好的预测功能,使得企业规划与决策更加可靠。图2展示了数据管理、数据梳理、数据监控、数据应用四者的关联关系图。
二、人工智能在保险大数据治理框架中的应用前景分析
人工智能理论方法与数据治理的关系是相辅相成的。系统通过数据治理,使得产生的数据质量更高且格式统一,从而为人工智能的相关模型提供更高质量的输入,为人工智能实际应用提供保障[6]。另一方面,人工智能的相关模型与算法也能够用于优化数据治理的相关功能,本文在这一节主要对人工智能相关算法在数据管理和数据监控方面的应用进行展望分析。
(一)人工智能算法在数据管理方面的应用分析
正如前面所讨论的,数据管理的目的在于发现数据间的关联关系,以便实现更为规范化的数据管理功能。这其中数据模型是数据管理的核心基础。通过一个稳定且可靠的数据模型,能够有效地挖掘出保险企业各种业务间的关联关系。这一类数据模型本质上就是人工智能理论中的相关模型的本体,如概念模型、逻辑模型等。一种典型的应用场景就是通过知识图谱的方式形象生动地展示实体及实体间的关系结构图。
(二)人工智能算法在数据监控方面的应用分析
数据监控的本质目的在于保障数据的安全,特别是保险等金融行业,直接关系到用户和企业的核心利益。为了能够有效保障数据的安全性,就需要对保险企业系统中规模庞大的数据进行有效分级。针对数据的有效分级可以通过人工智能理论中相应的文本无监督与有监督分类算法实现,从而对数据进行基于内容的实时精准分类分级,促进数据治理系统中数据监控功能的智能化[7]。
三、结论
随着大数据在保险行业应用的不断深入,数据治理作为企业的核心资源的地位日益凸显。鉴于数据治理受到越来越多的关注,本文给出了一种基于保险大数据的治理框架范式,并着重对数据治理中管理、梳理、监控、应用等功能进行了分析,最后,进一步展望了人工智能算法在数据管理与数据安全方面应用的前景。
[参考文献]
[1]蔡翠红,王远志.全球数据治理:挑战与应对[J].国际问题研究,2020(6):38-56.
[2]李柳音.数据治理中数据智能分类技术的应用研究[J].卫星电视与宽带多媒体,2020(9):15-17.
[3]杨琳,高洪美,宋俊典,张绍华.大数据环境下的数据治理框架研究及应用[J].计算机应用与软件,2017,34(4):65-69.
[4]张宁,袁勤俭.数据治理研究述评[J].情报杂志,2017,36(5):129-134.
[5]许健,王彦博,张杭川.以数据治理赋能银行金融科技[J].银行家,2018(7):73-75.
[6]赵大伟,杜谦.人工智能背景下的保险行业研究[J].金融理论与实践,2020(12):91-100.
[7]李雨霏.人工智能在数据治理中的应用[J].信息通信技术与政策,2019(5):23-27.
作者:吴倩 赵诚雅 叶立武 吴海洋 宋姗姗 王玮 单位:中国人寿保险股份有限公司