数牍科技宋一民:用隐私计算创造数据使用新范式
打车时的行踪信息,住酒店的个人信息,逛某宝的购物信息,进入小区的门禁信息……面对AI、大数据时代无处不在的数据流,如何把握价值挖掘和隐私保护之间的平衡,已经成为最突出的技术发展及产业推进的瓶颈之一。
在12月18日举办的数据资产管理大会政务大数据发展论坛上,北京数牍科技有限公司(以下简称“数牍科技”)创始人宋一民表示,就当下的工程实践来看,解决数据价值挖掘和隐私保护的两难问题,最好的方法是给数据拥有方一个控制力,包括对数据收集的授权和收集后保存和使用的控制。“建立高效的数据互联生态体系,用隐私计算技术,让数据对外‘可用而不可得’,同时尽可能扩大其应用场景。”他强调。
数据控制权
“目前非常突出的问题是数据流动过程中不经节制的应用,会带来数据隐私侵犯的隐患。”宋一民解释到,最近多个金融大数据公司遭到立案调查,从数据源的角度来看,其中一个重要原因就是这些公司的爬虫对触达数据未经授权的存储或超出约定范围的使用。
例如,某个 App 以帮助用户管理多个金融账户为由,要求用户提供这些账户的访问权限。在这一过程中,App 对个人银行账户内的所有信息进行了抓取和存储,并在未获得用户许可的情况下,将这些信息提炼出来的标签出售给第三方或用于开展新的业务,就是一种对数据使用权的滥用。
宋一民认为,当下解决这一问题最好的方法就是赋予数据拥有方控制权。国际上普遍进行的实践或者规范,如欧盟制定的《通用数据保护条例》(GDPR),都倾向于对个人拥有的数据及其数据的各种上下文环境进行准确授权。
“GDPR会要求第一方数据(数据采集方)明确自己采集到了哪些数据,并让用户在明白这些内容后有权选择‘保留或删除哪些’;在此基础之上,还会对数据处理方法做出明确问询和授权。”
但是,这样做必然带来公共资源的更多消耗以及数据使用门槛不断提高的挑战。其中,颇具代表性的挑战就是,如何在不侵犯个人隐私的前提下获得个人授权?
宋一民举例说明寻求这种平衡操作的可能性。比如为了获得用户的兴趣爱好标签授权,一般的做法是首先由数据挖掘方获得某个标签,再针对这个标签进行发散式的问询。宋一民他们的方法则是先做一张尽可能穷尽所有兴趣爱好的知识图,梳理出它们之间的关联性,然后再依据包含关系针对泛化的某类爱好进行问询。简单理解,这是一种“点到为止”的数据获取方式,在满足保护数据拥有者权利的同时,也能得到想要的效率和结果。
“这样做也很难说做到了完美。”宋一民同时指出,通过给予数据拥有方控制力的方式去平衡数据价值挖掘和隐私保护,就必须学会面对实践中出现的一个又一个新挑战。
隐私计算
隐私计算是近年来出现的颇具代表性的新兴技术领域。它通过技术实现数据“可用不可见”,让不同来源的数据安全共享,产生更大价值,具体包括了诸如基于密码学的安全多方计算(MPC)、源自人工智能的联邦学习、基于芯片的可信计算环境(TEE)等在内的各类技术的单项或综合使用。
“数据治理的核心目标是释放数据价值,而影响数据价值释放的一个因素就是数据泄露的问题,造成核心数据不敢开放,数据孤岛现象严重。”宋一民分析,随着国内《网络安全法》的发布,以及《个人信息安全法》《数据安全法》的推动,数据隐私保护的标准与监管正在逐步完善,这时候技术手段也同样需要跟上。
“数牍基于隐私计算技术打造了一种可行的解决方案,可以实现原始数据不出库而满足流动过程中的隐私保护及安全问题。”宋一民进一步解释,也就是数据拥有方可以控制谁在何时、以何种方式使用这些数据,对方无法看到真实数据,但仍然可以得到他想要的结果。 “它可以应用到政府对企业数据开放,企业对政府数据开放,以及政府之间数据开放中。”
例如,公安部门想要联合各地大数据机构以及金融、电信企业建立一个可疑诈骗人员模型,数牍提供的解决方案可以让这些机构原始数据不出库,通过建立当地模型并在各个模型间传递参数,最终得到想要的模型结果。这和数据汇集本地(出库)建模的效果是一致的。
在此过程中,各地大数据机构还可以将数据联动起来。每个大数据机构作为一个计算节点,在数据不用出库的前提下进行联合计算,从而得到可以被政府或企业信赖和使用的结果。
“这样做的另一个好处,就是可以将高价值的数据充分地利用起来,而不用担心数据隐私泄露的问题。”
据介绍,数牍科技自主研发了安全高效的隐私计算平台,并在运营商、金融、汽车等行业有着良好的工程落地实践。例如,数牍科技经过严格的技术测评和安全测评,成为联通大数据在多方安全计算领域的重要技术合作伙伴,双方联合打造基于隐私计算的大数据服务平台,服务广大政企客户。在各项测评中,数牍隐私计算平台显示出很强的去中心化技术优势,在数据处理能力、安全求交效率和联邦建模效率等方面显著领先同行。
数据使用新范式
回国成立数牍科技之前,宋一民先在美国读书,然后在微软和Facebook工作了10年,主攻云计算、大数据基础构架以及广告领域的用户数据价值挖掘等工作。他在Facebook时主导了与多个五百强公司的基于隐私保护的数据协作项目,这段经历促使他把职业兴趣更多地聚焦在数据隐私安全领域。
数牍科技既是宋一民既往职业积淀的一个必然结果,也是他实现创业梦想的新起点。成立不久的数牍,就与中国信息通信研究院联合起草了多项隐私计算相关标准,并联合信通院安全所发布了国内首个《隐私保护计算技术报告》。这个核心成员来自 Facebook、Google 等企业的年轻团队,目前已经拿到红杉中国、招商局创投、红点创投等知名风险资本的融资,不断拓展行业应用和数据协作项目落地。
在宋一民看来,对于隐私计算这个新兴产业,需要采取一种渐进式的推广方式来顺应市场,然后在“双向作用、螺旋上升的过程”中迎接数据价值挖掘的下一个爆发点。为此,数牍科技在其解决方案中增加了诸如数据流控制的设计,让数据拥有方可以决定数据流向的单向或双向,从而增加在现实环境中应用的灵活性。类似的做法既是为了规范数据使用,也有规范市场发展的意图。
“我们期待在未来十年,在隐私规范的推动下创造出新的数据使用范式,推动AI的数据基础设施革命,而数牍能够参与其中并贡献自己的力量。”宋一民表示。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。