陈建:如何平衡大数据发展与消费者隐私保护?
几十年以来,如何解决金融机构与消费者之间的信息不对称,实现金融供需平衡,一直是金融行业致力于解决的核心命题。因此,依托于当下时代的技术条件,中国的金融产业一直致力于通过各种各样的数据、算法、模型等技术来打破金融信息非对称的状态,并在近些年取得了显著的成果。
在这个过程中,随着数据价值被越来越多的行业认可,大数据产业得到了长足发展,尤其受到银行、保险等众多金融机构以及金融科技公司的关注与追捧,使得金融行业成为各行业中应用大数据相对最全面、最成熟的行业。据IDC的数据显示,政策利好、需求旺盛、技术支撑等原因使得中国大数据行业未来发展值得期待。2020-2024年,中国大数据市场将以19.7%的高速增长,高于全球的10.4%。而且从大数据应用行业分布情况来看,金融、政府和通信是大数据领域投入最多的行业,这三个行业贡献了2020年中国大数据市场38%的规模。
大数据产业的快速发展,在产生诸多价值的同时也带来了大量的安全风险与挑战,引发了人们对于数据安全、数据隐私等话题的关注。数据安全、数据隐私对个人安全、行业发展、国家经济安全的重要性不言而喻。如今我们的生活与工作都与互联网紧切连接,个人信息在许多不经意的场景下会被一些机构或个人在并不困难的情况下获取。在互联网中有关个人的海量数据经过人工智能、大数据等技术的筛选、排序、整理,或可形成足以洞穿个人日常行为,甚至是性格特征的数据网。如果这些数据被一些人或机构非法捕获并加以利用,或许会对个体、公司、社会、国家造成难以预计的损失。
一方面,我们既要理解数据行业的发展是大势所趋,我们需要利用大数据等信息科技发展数字金融、数字经济,推动国家尽快实现数字化转型;另一方面,我们也要做好保护数据安全和消费者隐私的工作,毕竟构成庞大数据的基础是一条条基于消费者个人的数据。因此,在大数据产业发展势头强劲的背景下,如何平衡大数据发展与消费者隐私保护的关系,二者之间的“度”怎样把握,是决定未来大数据产业能否健康、快速、持续向前发展的关键。
大数据发展与消费者隐私保护之间“度”的准确把握,离不开“战略”与“战术”两个层面。战略层面即指国家的大数据政策和顶层设计;战术层面即大数据产业落地过程中的各类技术运用。
我国政府高度重视大数据在推进经济社会发展中的地位和作用。自十八届五中全会首次提出“国家大数据战略”,标志着大数据战略正式上升为国家战略以来,大数据产业正在成为中国经济发展的新动能,政府颁布了一系列政策支持、推动、规范大数据产业的发展。
2015年8月的《促进大数据发展行动纲要》作为我国推进大数据发展的战略性、指导性文件,充分体现了国家层面对大数据发展的顶层设计和统筹布局,为我国大数据应用、产业和技术的发展提供了行动指南。
2017年初的《大数据产业发展规划(2016-2020年)》在分析总结产业发展现状及形势的基础上,围绕“强化大数据产业创新发展能力”一个核心、“推动数据开放与共享、加强技术产品研发、深化应用创新”三大重点做出了明示。
《关于工业大数据发展的指导意见》则指出,未来三到五年,随着5G、工业互联网、人工智能等的发展,工业大数据将从探索起步阶段迈入纵深发展阶段,迎来快速发展的机遇期,全球工业大数据的竞争也将变得更为激烈。
从推动大数据产业发展到消费者个人信息保护,政府越来越关注个体信息安全,以及个体在大数据发展过程中的利益得失。8月20日,十三届全国人大常委会第三十次会议表决通过《中华人民共和国个人信息保护法》,自2021年11月1日起施行。作为中国首部个人隐私信息保护的专门性立法,《个人信息保护法(草案)》曾提请全国人大常委会会议第三次审议,三审稿进一步回应了社会关切,特别对应用程序(App)过度收集个人信息、“大数据杀熟”等作出针对性规范,同时对个人信息跨境提供规则作出相关规定。
广大消费者最关心的涉及自己的私密信息是否会被违法收集,以及之后是否会被相关个人或机构保管不当或非法利用。在这方面,国家政策积极正向引导和规范,许多企业也在不断发明、迭代新兴技术,致力于消费者隐私保护。
从技术方面来讲,如何既创造性发挥大数据作用,又保护消费者隐私、注重数据安全,一直是政府和各有识企业所双向倡导的方向。在这里,我们有必要梳理一下大数据处理技术的发展过程,也有利于我们更好地理解大数据的利用与隐私保护。
在2015年以前,行业对大数据的获取、存储、整合与利用往往是物理层面的。如央行征信中心将各个商业银行的信贷数据汇总到央行,然后进行分析和整合提供信用报告;或一些大数据公司利用各种手段获得原始数据,然后进行综合评价。在数据的物理整合过程中,涉及到数据获取、数据披露、数据交换、数据买卖等与消费者隐私保护相关的一系列有争议的话题,引发了政府和业界的广泛关注。
2015年之后,利用人工智能、云计算的技术对加密大数据进行分析后再进行加密输出的虚拟整合数据的方式逐渐流行起来。这种虚拟整合数据的方式,不需要把数据用物理方式汇集到一起,而是通过在各个数据源端部署大数据分析与挖掘的算法模型,在每个数据源端输出算法模型的计算结果,比如各数据源算出若干个子评分,再通过人工智能的方法将若干子评分在云端进行整合,最终输出一个对于消费者的综合评价分。
中国的大数据分布在一个又一个的数据孤岛里,要精准地为全体中国消费者打破信息不对称,依靠某个数据孤岛不行,需要整合各个数据孤岛。通过虚拟整合数据的方式,各个数据孤岛的数据不用再以物理形式“相聚”在一起,而是通过人工智能的算法在云端实现了整合,从而有效避免了数据披露、数据交换、数据买卖等与消费者隐私保护相关的一系列有争议的话题。
大数据行业从业者众多,产品复杂且多样化,但万变不离其宗,都是希望能将数据物尽其用。如何合理合法且在保护消费者隐私的情况下实现对数据的最大化挖掘,亦是巨大的考验。
新一代的技术模式实现了大数据的生产力和数据隐私保护之间的隔离与融合,受到了行业的肯定。目前,比较主流的方式是将数据在不落地、不留痕、不存储、不传输的基础上进行虚拟整合,既充分发挥数据的生产力,又能保护消费者隐私,充分实现数据的可用不可见。举例来说,睿智科技是这一技术模式的首创者,其大数据评分正是行业的最有公信力的代表之一。依托人工智能算法在云端整合数据的洞察力,一经推出就受到了银行等各类金融机构关注与青睐,成为其首选的评分产品之一。
党中央、国务院非常重视普惠金融发展。普惠金融是“十四五”时期实现2035年远景目标的重要方向,也是中国金融业转型发展的重要基调之一。而要真正实现普惠金融,就要同时实现“普”和“惠”。
打通数据孤岛、通过虚拟整合数据方式实现对消费者信贷风险的精准评价,金融机构可以决定是否为他们提供金融产品支持,从而可以有效促进金融需求和供给实现平衡,为金融普惠的实现打下了坚实的基础。未来建设数字金融、数字经济,大数据广泛的分析提炼和运用亦是必由之路,是未来不可抵挡的技术潮流和产业潮流。