扫描二维码
关注北京大学汇丰金融研究院官方微信/微博
数据治理的挑战
征信行业在数据采集上一直备受瞩目。历史悠久的美国征信行业在数据采集规模和效率上常常引起“惊叹”。随着数字经济的发展,数字技术与实体经济加速融合,数据成为关键生产要素。根据IDC预测,2025年全球数据量将高达175ZB。其中,中国数据增速最为迅猛,预计2025年将增至48.6ZB,占全球数据量的27.8%。随着数据量的爆发式增长,数据的创新应用正在加速产业优化升级、促进经济持续增长。
数据的丰富和快速增长,为征信行业提供巨大的数据资源,数据采集技术也更加先进。征信行业成为“大数据”的受益者,也面临着挑战,许多机构用“非征信数据”(或称“替代数据”)达到了“征信”的效果。如果我们把这一类新兴的业务也纳入到征信体系考量,那么广义上的征信行业对数据的需求可谓无穷无尽。有不少数据公司在推介自己的业务时经常介绍自己能够提供数万个数据维度用于衡量用户的征信情况。
这样的局面带来一系列前所未有的数据安全问题,过度收集、隐私泄露以及垄断等问题不断暴露出来,导致信息主体的合法权益保护面临挑战。
数据过度收集
当前,我国全面进入移动互联网时代,手机网民规模达9.86亿,网民使用手机上网的比例高达99.7%。App成为消费者经济生活的必需品,在促进经济发展、服务民生等方面发挥着重要作用。但与此同时,App强制授权、过度采集用户信息、公开隐私政策制定不合格等问题普遍存在。以金融App为例,根据零壹智库发布的《2020年金融App测评榜》,被测评的200个金融App中,超38%的App超范围搜集与其业务无关的个人信息,超过45%的App在用户不同意隐私政策时,强制退出。
数据泄露
过去数年,全球范围内大规模的数据泄露事件频繁发生,包括国家、政府到企业、个人,都曾遭受数据泄露带来的损失。2020年全球数据泄露的数量超过过去15年的总和,一些不法机构通过非法获取、贩卖黑产数据而获利,造成个人隐私数据泄露。
除非法爬取数据外,数据贩卖更是形成了黑色产业链。2020年,全国公安机关破获窃取、贩卖人脸数据案件22起。据2021年“3·15”晚会曝光,多地商家装有具有人脸识别的摄像头,在客户毫无知觉的情况下,偷偷收集海量顾客人脸信息;智联招聘、前程无忧、猎聘网等多个招聘平台业也存在泄露求职者简历的现象,并已经形成黑色产业链。
数据垄断
目前,各网络平台的商业推广、精准营销、产品迭代等业务发展均由数据所驱动。凭借自身强大的技术能力和广泛的用户基础,各网络平台打造了自己的“数据王国”,在利用数据追求自身利益最大化的同时,基于数据垄断优势,要求消费者进行“二选一”,对消费者进行“大数据杀熟”,严重侵犯消费者的合法权益。
2020年11月,市场监管总局发布《关于平台经济领域的反垄断指南(征求意见稿)》,网络平台因“大数据杀熟”“二选一”事件被推向风口浪尖。2021年4月,市场监管总局等相关监管部门联合对美团、拼多多等网络平台企业进行约谈。数据的垄断,影响了数据的正常流通,干扰了数据市场的正常发展秩序。
“泛征信”泛滥
随着平台经济的盛行,各细分领域的网络平台积累了海量的社交数据、电商数据、出行数据等“非征信数据”(或称“替代数据”),网络平台利用自身积累的“非征信数据”提供信用评分、信用画像及信用评估等征信服务。同时,还有一些具有数据处理能力或者拥有数据的金融科技公司,为金融机构提供助贷、反欺诈等信用服务。这些网络平台和数据公司没有征信牌照,却提供着征信服务。
互联网金融的粗放式发展带来了个人信息在信贷领域的滥用。一些公司通过非法爬取、强制授权等不合法的方式采集用户信息,为互联网金融公司提供反欺诈、风险测评、信用评估等信用服务。
凡此种种,为数据安全、隐私保护和金融稳定带来巨大隐患。近年来,相关部门陆续出台了相关政策法规和监管措施。一方面,从金融监管等具体业态入手,厘清具体业务中信息处理和使用规范;另一方面,从数据安全和个人信息保护等方面入手,制定“基本法”。尤其是2020年以来金融监管的系列措施和2021年数据安全法和个人信息保护法的实施,为数据行业中的特殊行业——征信行业,在数据获取和使用方面画出了基本的框架。
金融机构主体责任与“断直连”
对“泛征信”的治理,不仅仅是从治理数据公司下手的,另一手更关键,是对金融机构的相关业务的规范。2020年监管部门对商业银行互联网贷款中“主体责任”进行要求,强制要求商业银行改变对外部数据服务和风控服务的依赖。2021年对数据“断直连”的要求,则重新定义了这个生态链:持牌征信机构成为关键连接点。
2020年7月12日,《商业银行互联网贷款管理暂行办法》(以下简称《办法》)正式颁布实施。其中两个方面对征信行业影响重大。
第一,《办法》强调商业银行在互联网贷款中的主体责任,尤其是在某些方面和环节要具备独立完成的能力。比如,《办法》要求:“商业银行应当合理分配风险模型开发测试、评审、监测、退出等环节的职责和权限,做到分工明确、责任清晰。商业银行不得将上述风险模型的管理职责外包,并应当加强风险模型的保密管理。”一些外部“泛征信机构”(数据公司、风控外包等)为银行包办业务的机会彻底结束,也阻止了银行被“通道化”的倾向。
这意味着,在每个场景下,个人信息处理者只能获得非常有限的信息。而多维度信息的有效共享,才能全面刻画信息主体的信用水平。这样,征信所需要的信息,需要从更加多元的数据服务商处获取。
第二,数据服务市场潜力巨大。2013年,美国参议员杰伊·洛克菲勒召开听证会,他声称观察到数据代理商行业在上一年(2012年)创造了1560亿美元的收入,这个数字比美国政府情报预算的两倍还多。这样的数字引起很多人的震惊和对数据代理行业是否威胁个人隐私的质疑,但是从另一个侧面来看,数据服务行业在数字经济时代,具有巨大的市场空间。如今将近十年过去了,在新的法律法规下,在越来越数字化的经济和金融需求下,合规的数据处理行业必然是巨大的市场。