隐私频繁被“卖”,如何打通数据保护的“真空地带”? | 超级观点

来源:36氪
发布时间:2020-05-09
打破壁垒、连接孤岛,是数据打通的使命。

带着观点看商业。超级观点,来自新商业践行者的前沿观察。

文 | 特约观察员 崔晓波

编辑 | 吕方

 特约观察员 崔晓波

近日,脱口秀演员池子的一条微博将用户隐私问题推上了热搜。

虽然相关银行很快发布了“致歉信”,承认存在违规操作,并对涉事员工进行了处分,但关于如何避免个人隐私泄露以及如何保障隐私权益的问题,仍在持续发酵。

这次的事件并不是关于隐私保护讨论的个例,疫情开始以来的这几个月,一直都有相似的声音存在。比如疫情刚开始不久,就发生为了防疫收集的个人信息被发布在社交群组、甚至传播到网络的事件。这些看上去为了保障安全的举措,反而将个人隐私置于风险中。

作为影响全球的突发事件,疫情体现了大数据作为战略资源的价值,也暴露出数据应用中存在的泄露、滥用等安全风险。

但疫情下的日常场景,比如出入各个地方要核查的健康码,新闻在跟进最新的确诊病例和传播路径,政府会通报各地人口流动、复产复工情况,医疗和科研机构在分析疫情规律、寻找有效药物,这些都构建在对各种数据的打通和利用上。

数据打通应用与个人信息保护之间是否矛盾以及如何平衡,成为当前大数据领域重要课题的缩影。

不用可以吗?

为了保护信息安全,最简单的方法可能就是“不用”、“不打通”,但我们都知道这是不可能的。

以防疫需求为例,在现有应用基础上,我们还想要更多——例如一个健康码全国通用,这需要跨地区、跨部门的数据打通;更精准、更有预见性的联防联控与民生保障措施,需要交通、医疗、物流、互联网等等跨行业的数据打通;更全面的疫情研究与更快速的药物研发,需要跨机构甚至跨国的数据打通。

即使没发生疫情,上至国家战略、下至日常生活,外至国际竞争、内至提振经济,数据已经成为了基础性、核心性资源。

3月4日,中共中央政治局常务委员会召开会议,指出要加快数据中心、5G等新型基础设施建设进度。4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,进一步明确数据作为重要生产要素的地位与作用、市场化配置原则及发展方向。

需求是来自各方的。政府有更好地增强国力和促进经济发展的需求,企业有更好地创新和盈利的需求,我们每个人也有提高生活便利性的需求。而想要让数据成为生产要素层的资源,产生惠及全社会的价值,把数据“打通”成为“大数据”是必然选择。

对数据打通应用的担忧,根本在于对信息安全的担忧。而这两者之间本不矛盾,关键还是在于如何去做。

问题出在什么地方?

国内科技的进步和社会的变化是呈指数级的,实际上大数据的发展就是近十年的事情。中国的独特环境提供了土壤,我们的需求和应用跑的很快,其他方面则慢了一步,这一定程度上造成了个人信息保护领域的“真空”。

数据作为一种虚拟物品,在全生命周期中由不同的主体所支配。而明确数据的权属,即“数据确权”,这个基础的问题尚未有清晰的界定。与“权属”密切相关的是“规则”,我们需要明确的规则,去界定数据的实际控制者可以做什么、不能做什么,这也亟需从行政立法、行业标准和市场准则上进行突破。另外,对数据的采集资格目前也没有统一的规定,在不同行业可能会产生不同的要求。

此外,技术和场景在不断演进,个人信息的范围也在快速变化。近两年随着人脸识别、运动健康等等应用的快速普及,这一类生物信息也成为有待保护的数据类型,对法律法规的完善提出了新的要求。

TalkingData自研的基于web浏览器的情景感知技术

还有一方面的挑战,在于我们每个人到底愿意出让多少个人信息,来换取怎样的便利性。公众对信息安全的意识虽然在增强,但对哪些是“隐私”、如何管理和保护“隐私”等问题上仍有很多不了解甚至误解。

在数据打通应用以及个人信息保护上,企业承担着重要的责任。遵守法律法规是前提和底线,但要通过怎样的方式,既守好合规性的底线,又拓展商业发展的上线,并不是那么简单。

一个部门、一家企业甚至一个行业、一个区域的数据经常被称为“数据孤岛”,因为其远远不够支撑更深化的应用需求。打破壁垒、连接孤岛,是数据打通的使命。以往通常采用的方式是“数据交易”或“数据交换”,将数据经过脱敏加密或者标签化加工后进行输入输出,再与其他数据进行匹配、扩展数据维度,从中提取到某种规律或者新的认知。

做好这一切是有一定门槛的,并不是所有企业都有这样的实力。技术上,要考量企业是否能做好数据存储、处理以及输入输出等过程中的安全性。管理上,则要看企业是否有完善的制度,能充分避免可能的疏漏或违规。

法律法规体系存在固有的滞后性。无论从政府、企业还是普通用户,都不能只是被动等着法律的执行。平衡数据打通应用与个人信息保护,需要更积极的态度和手段。

更好的方法是什么?

这两年针对性的法律法规和行业标准在逐步出台。例如《网络安全法》和《个人信息安全规范》对数据的使用边界进行了规范,提及数据控制者只能将数据使用于其收集时所承诺的目的范围。而今年4月出台的《网络数据安全标准体系建设指南》(征求意见稿)要求建立包含基础共性、关键技术、安全管理、重点领域四大类标准的网络数据安全标准体系,并提供每类标准可参考的具体规范标准。此外,已有一些规范标准明确规定出相应的监管部门,国家也在不断加大对相应违法行为的执法力度。

法律法规和行业标准的完善与明确,一定会给相关行业带来阵痛。没有足够意识和能力的企业会逐步被淘汰,而幸存的企业也必须去满足更高的要求。但对长期发展来讲,这绝对是利好。

法律法规之下,我们对“数据打通”的思路必须转变。企业通常将数据用于分析、洞察、预测等等相关方面,其实就是在数据上进行各种计算。传统的“打通”模式利用的是数据本身,需要将数据移动、集中到一起,这个过程就自然存在着风险。

未来更好的方式是“连接”,不用移动、交易或者交换数据,而是基于大数据和人工智能技术,将算法移动到各个数据源进行计算,同时对数据源和计算过程进行双重加密,以“数据不动、算法流动”的方式将数据连接起来,最终利用的是由算法计算出的结果,而不是直接利用数据本身。目前,业内已经探索了一些相应的解决方案,比如同态加密技术、联邦学习技术、OPAL开放算法技术等。

同态加密技术是利用相应算法,直接在加密数据上进行计算,而计算结果与在不加密数据上直接计算的结果相同,在保证计算结果准确性的同时,又借助加密来避免隐私泄露。

而联邦学习技术支持将机器学习模型直接分布到数据所在位置,进行分布式的学习预测,并对模型参数的交换也进行加密,实现不需要集中数据就可以连接多方数据进行机器学习。

MIT OPAL(Open Algorithms)开放算法技术框架

OPAL开放算法技术则是麻省理工学院提出的创新方案,TalkingData也参与了研发和应用。其原理类似于联邦学习,也是通过不移动数据而移动算法来获得计算结果。但OPAL更为灵活,不仅支持机器学习算法,也支持其他统计算法,适用面更广。再加入审计、区块链等技术,可以更全面的规避风险。

在技术之外,管理也是重要因素。从企业内部管理来看,需要制定数据分类分级机制,对不同敏感程度的数据,采用不同的审批流程和保护措施。同时,围绕数据全生命周期,明确数据采集、传输、储存、处理、交换、销毁各个环节的相应安全管理制度,实时监控轨迹、挖掘潜在风险,一旦发生安全事件,则立即启动安全应急响应机制。

从企业外部合作来看,尤其是在数据打通连接的场景下,要对合作方的数据保护能力进行一定审查,同时采取相应的技术措施保障安全合规。

未来走向何方?

国家工业信息安全发展研究中心发布的报告显示,自2016年来我国大数据政策、制度、研发、产业、融合等指数都持续增长,大数据产业规模在2019年超过8000亿元,到2020年底预计将超过万亿。

今年接连出台的“新基建”规划与《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称“意见”),可以说为大数据产业定了调——对大数据不仅要发展,而且要大力发展。

新基建的数据中心、5G与工业互联网基础设施建设后,必然需要大量的应用带动。结合“意见”中强调的推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护三大方面,数据的连接共享和可信化流通将会成为应用的重点方向。

在企业自身积极进行技术和模式创新的同时,更迫切需要建立起联结各方、可信共享的数据流通体系。例如中关村大数据产业联盟与国务院发展研究中心国际技术经济研究所合作、与TalkingData共同发布的“数据标识互联示范应用”(简称“数联网”),旨在不改变现有数据管理格局、不改变数据权属和不侵犯个人隐私的情况下,形成完整的社会数据资源,满足大数据在国家安全、社会治理、经济发展等方面的应用需求。

回到当前大众最关心的问题上,数据打通应用与个人信息保护比较理想的平衡模式到底应该是怎样的?

仍以疫情为例,我们为防疫提供的个人信息,应以私密方式收集、加密方式传输,将信息转为人类无法理解的编码,并以假名化形式进行标识(即给数据主体设定一个代号,而不是直接使用真实姓名),与其他数据连接打通时,也通过假名进行匹配。一旦发现确诊病例,通过移动算法对分别存储的交通、位置、消费等各类数据进行分析,快速发现以假名标识的密切接触者,在保持加密的状态下进行定位,只有具备相应等级和授权的相关人员,才能查看到有限必要的真实个人信息,以便于准确查找和隔离、送医。

数据已经成为一种生产要素和战略资源,良性应用发展于国于民都有益。而个人信息保护涉及每个人的切实权利,也体现着社会的文明水平。从行业发展来讲,关键是要促进意识、规则、行动的改变,把数据从“占有”变为“合理利用”,把“交易交换”变为“连接共享”,把“短期利己”变为“长期共赢”,从法律法规到行业标准、从技术创新到人员管理、从政府到企业到个人,都将数据的应用和保护放在一起,而不是作为对立面去考虑。

“超级观点”栏目现发起“特约观察员入驻”计划,邀请各赛道的创业者、大公司业务线带头人等一线的商业践行者,在这里分享你的创业体悟、干货、方法论,你的行业洞察、趋势判断,期待能听到来自最前沿的你的声音。

欢迎与我们联系,微信:cuiyandong66;邮箱:guanchayuan@36kr.com。

本文图片来自:采访供图锐景创意 正版图库