[摘要]本文对证券行业反洗钱内部审计工作面临的形势进行了分析,剖析大数据技术在证券公司反洗钱内部审计中的应用前景,基于实践介绍部分反洗钱审计模型的开发思路、应用方式与注意事项。
[关键词]大数据;反洗钱;内部审计;模型
近年来,反洗钱执法机关持续加大对金融机构反洗钱工作的执法检查力度,2019年人民银行共检查证券业机构138家,处罚违规机构24家,同时对以往年度被检查机构开展“回头看”监管走访,核查问题整改情况。人民银行在全国范围内实现法人金融机构反洗钱分类评级的全覆盖,根据分类评级结果开展监管成为常态。在此监管环境下,证券行业反洗钱工作压力日益加大,对开展反洗钱内部审计工作的要求也随之不断提高。应用大数据技术开展反洗钱内部审计,是提升反洗钱审计工作效率效果的有效方法。
一、传统反洗钱内部审计面临的挑战
传统反洗钱内部审计主要采用审计抽样方法,对客户档案、交易记录、可疑交易分析报告等材料进行抽样,基于样本推测整体反洗钱工作情况。此方法具有覆盖面小、效率低、时效性差、问题揭示率低等缺点,为此可引入大数据技术开展证券公司反洗钱审计:全面提升反洗钱审计覆盖广度,由抽样估计变为全量筛查,全面揭示存在问题,促进问题全量整改;汇集审计人员审计经验,综合利用公司内部与外部数据,有效加大反洗钱审计探索深度,深入筛查可能存在的问题;通过程序化的审计模型,结合自然语言理解等技术手段,可对人工难以判断的跨对象、跨系统、跨时间的数据关系,文本等非结构化数据进行分析过滤;全面提升审计时效性,变低频度的反洗钱专项审计为准实时跟踪审计,持续揭示反洗钱工作提升情况,发现问题突发领域,及时提示业务部门规避监管风险。
二、大数据反洗钱审计的系统架构
利用大数据技术开展反洗钱审计的前提是审计部门能够通过公司级的大数据平台或数据仓库获取到覆盖全公司各系统、各业务类型、各机构分支的全量数据,进而利用技术手段将客户的账户信息、交易数据、管理动作信息进行关联,打破数据孤岛,形成以客户信息为中心,关联覆盖客户交易信息、业务权限、资产与交易、洗钱风险等级、审查调查历史等信息的审计宽表,在此基础上汇总审计人员知识与经验,进行分析建模(见图1)。
三、大数据反洗钱审计模型实践
在具备数据分析环境的基础上,对反洗钱工作所涉及的外部监管环境、内部主要工作环节与流程进行分析,辨别反洗钱工作所面临的主要风险,基于历史审计发现与审计人员经验,归纳可能存在问题的审计关注点。基于数据基础好(相关信息均已录入信息系统且数据规范性高)、判定规则明确(可基于数据特征直接或大概率判定问题性质,无须或较少需要线下材料作支撑)、监管检查重点关注(尤其是处罚高发领域)三大筛选条件,可将反洗钱审计模型的主要关注领域集中于客户身份识别与资料保存、客户洗钱风险等级评定与应用、大额和可疑交易识别等反洗钱工作领域。(一)客户身份识别审计模型。以监管检查数据口径为数据检验基本对象,参考《证券期货保险机构反洗钱执法检查数据提取接口规范》(以下简称《接口规范》),提取客户身份关键信息,进行数据完整性、有效性、匹配性、一致性、统计特征等方面的校验,以发现客户身份识别方面的基础问题。《接口规范》列示的客户身份信息字段是反洗钱执法部门所关注的客户基础信息的集合,而内审部门可基于自身内控需要,进一步扩大关注范围,扩充提取客户身份数据字段,以便对特定问题展开排查工作。具体可开展以下数据校验:一是身份信息的完整性。检查是否完整采集维护了客户身份关键信息,各字段是否有缺失、仅填充缺省值的情况。二是身份信息的有效性。身份信息是否满足相应的长度、格式、明细程度等规则。比如,中国籍个人客户身份证号码应满足《中华人民共和国居民身份证法》所规定的编码规则,可针对号码长度、前六位地区码、末位校验码的正确性进行检查;客户手机号码应满足手机号的长度与号段规则,并且不能全部取0、6、8等编造的号码;客户应留存明细地址,可检查地址字符串的长度是否过短,地址末位是否包含“#、栋、号、室”等表示明细地址的关键字词。三是身份信息的关联匹配性。检查同一客户身份信息不同字段之间、客户与其归属机构属性之间的关系是否合乎规则。比如,客户国籍与其证件类型的匹配性;客户职业信息与其年龄的匹配性;身份证的有效期长度与发证时年龄的匹配性;客户性别与身份证号码某位取值的匹配性;客户常住地址与机构所在地的匹配性等。四是多账户信息的一致性。通过客户留存的证件号码,找到同一客户开立的多个账户,对比不同账户留存的关键身份信息是否一致。五是数据重复的合理性。比如,检查不同客户留存同一联系地址、同一手机号的情况;同一人代理大量客户办理业务情况等。六是统计特征的合理性。统计不同分支机构客户的职业分布占比、年龄分布等特征,横向对比筛查各机构中以上分布特征明显不合理的实例。此项分析应考虑不同地域经济、人口结构特征的实际差异。比如,江浙沿海地区个体工商业占比较高、西部和东北地区客户平均年龄相对较大。为解决客户基础特征分布不一致的问题,可按地理区域分区进行统计筛查,选出各区域内明显不同于其他机构的对象,进行进一步探索分析,了解问题成因。七是机构客户身份的识别。对于机构客户,除了对机构自身工商注册信息进行以上校验外,还需对其干系人,包括法定代表人、控制人、负责人、代理人、受益所有人的个人关键信息进行校验。公司内部存储的客户数据仅代表客户历史信息,无法反映客户关键信息的最新变化。而机构客户的工商注册状态、法定代表人、股东、受益所有人等关键信息变化频率远高于个人客户,且对反洗钱工作有重大影响。因此在利用公司内部数据进行校验之外,可充分利用当前市场上丰富的第三方企业征信数据服务,对机构客户的关键身份信息定期进行比对。值得注意的是,第三方征信服务公司的数据由于更新周期、数据来源等原因,并非完全精确,应注意辅以人工鉴别。(二)客户洗钱风险评级管理审计模型。在客户洗钱风险等级评定管理工作方面,可编制静态数据筛查模型和动态变化筛查模型。其中静态数据筛查模型用于查看公司洗钱风险评定工作是否完整执行了既定评级标准。基于本公司客户洗钱风险等级评分标准,选择典型评分项。比如,高风险国家和地区客户、身份信息不全、证件过期、受益所有人不明确等典型的较高风险事项,编制筛查模型,查找是否包含以上风险事项的客户、但对其风险评分中没有进行考虑。动态变化筛查模型用于考察客户发生重要事件后,相关部门是否及时调整了客户风险等级或进行了反洗钱尽职调查。此方面可综合公司的结算、合规、柜台等数据,并引入外部第三方数据,考察客户在发生关键信息变更、被司法调查/协查、收到司法/监管处罚等重要事件后,是否及时进行了反洗钱尽职调查或风险等级重新评定,且在相关工作中是否考虑了重要事件的影响。(三)客户交易管理审计模型。客户交易管理审计模型主要关注证件超期客户、高风险客户及证件超期客户的业务限制情况。对于证件超期客户,一方面可筛查是否及时在交易、账户等系统中对其进行了必要的交易权限限制,筛查为证件失效客户开通新业务、新权限的违规操作明细;另一方面可结合客户证件超期时间与营销管理等系统的客服通话、短信发送日志,查看相关工作人员是否及时提醒客户证件超期情况,尽到了告知义务。对于较高风险等级的客户,结合公司业务系统内的审批记录,筛查与相关客户建立业务关系、开通权限、进行交易的过程,是否经有权人员审批。(四)大额和可疑交易分析质量审计模型。大额和可疑交易分析简单套用模板、分析逻辑不正确是近年来监管处罚的重点之一。自然语言理解与文本挖掘技术可有效提高涉及效果,以下为具体示例。一是简单套用模板分析模型。针对部分分析报告简单套用模板、重复套话的情况,可引入自然语言分析领域的文本相似度算法。通过计算不同大额和可疑交易分析报告的文本相似度,找到相似度过高的分析报告,即为疑似简单套用模板的重点对象。文本相似度算法可以提取句子主干,过滤副词、助词、数字等次要信息,并可对同义词、近义词进行归并。由于对全量大额和可疑交易分析报告均进行相似度计算的开销较大,考虑到简单套用模板主要是以同一工作人员、同一机构为单位的动作,因此可以按分支机构、时间段为单位对分析报告进行分池,仅考察同一池内报告的相似情况。二是大额和可疑交易分析内容错漏筛查模型。在大额和可疑交易分析报告中,调查人员应对客户的资产、交易等情况进行严谨的调查与描述。但实际工作中存在对资产、交易量描述不充分的情况,直接影响分析报告的结论可靠性。可通过关键字抽取报告中的客户关键信息,并与交易系统、客户关系等系统中所统计的客户相应属性作比较,判定大额和可疑交易分析报告中描述的客户属性是否有重大错漏情况。(五)反洗钱工作时效性分析模型。为检查反洗钱基础工作的完成率与完成时效情况,可对反洗钱系统、OA等系统中反洗钱相关工作流的关键环节完成时点进行提取与分析,进而筛查客户身份尽职调查、大额和可疑交易调查、客户风险等级评定、客户交易权限限制等工作的初查、复核等环节的完成率、完成时长情况。
四、反洗钱审计模型成果应用
通过对客户身份、交易信息的全量筛查,可对问题账户精准定位,大幅提高审计筛查广度与深度。问题明细可供审计对象及时查漏补缺、联系客户进行信息补录或更正,提升审计问题整改的有效性,及时规避监管风险。在得到问题明细的基础上,可对各明细结果进一步开展多维度汇总分析,横向分析问题所涉及的客群属性、地域属性、归属机构、业务类型、时间集中度等情况,从更高的角度揭示问题发生的主要环节。另外,可纵向跟踪分析反洗钱问题的历史变化情况,开展反洗钱专项跟踪审计,持续跟踪历史问题整改情况,监控新发风险环节。
五、大数据反洗钱内部审计提升建议
一是提高基础数据质量和审计人员技术能力。大数据反洗钱审计基于对数据的程序化处理筛查而开展,因此对基础数据质量有较高要求。基础数据的准确性、完整性、一致性方面问题均会对模型检查结果产生较大影响。因此,审计人员除了了解反洗钱工作流程与规范外,还需了解具体业务与业务/管理系统、底层数据之间的关系,并掌握数据分析模型开发技术。二是持续维护与完善反洗钱模型。审计人员需持续跟踪关注反洗钱相关法律法规、内部管理规章制度、业务类型与流程、信息系统处理规则方面的变化发展,各方变化均可能导致既有反洗钱模型的失效,因此需要持续维护与完善相关模型。三是保护客户隐私数据。进行反洗钱审计模型的开发运用,需要访问客户身份信息、交易流水、资产明细等隐私信息,因此需要对数据访问与使用进行控制,以防止客户隐私数据的泄露与滥用。使用第三方征信公司的数据服务时,除了向公司内部获取客户信息之外,还存在需向外部机构传输客户信息的可能,此时应注意控制所传输客户信息字段的范围与传输方式,进行必要的拆分、变换和加密,一方面避免泄露公司客户名单,另一方面避免外泄客户隐私数据。
参考文献
程东亮.人民银行基于大数据的反洗钱模型探讨[J].金融科技时代,2018(3):40-43
刘永生,牟巍,赵志刚,等.大数据分析在商业银行反洗钱内部审计中的应用[J].中国内部审计,2019(9):76-80
邱华勇,蒋剑飞,林芝,等.证券期货业反洗钱模型及实践[J].金融电子化,2018(8):55-56
作者:苏杭 刘冬梅 李丙泉 单位:中国银河证券股份有限公司中国投资有限责任公司