
近日,由PCview隐私计算研究院主办的《数据隐领未来:隐私计算应用于发展的论坛》邀请到天冕科技隐私计算技术负责人许文彬分享他在隐私计算方向的思考和探索。
许文彬介绍,天冕科技是国内一站式科技服务商,自成立以来便积极探索创新,基于母公司WeLab汇立集团多年来在金融业务场景的深耕与积累。天冕科技通过数字化创新,以核心科技底层基础设施为基础,推出数据中台、隐私计算、信贷风控、AI实验室以及综合解决方案五大产品线,从单一的产品服务升级为覆盖客户业务全生命周期的解决方案,旨在为客户提供更加专业、便捷、智能的服务。
在许文彬看来,从农业时代到工业时间,再到当前的数字时代,数据成为第五大生产力。农业时代土地和劳动力是核心要素,工业时代资本和劳动力是核心要素,进入数字社会后,数据成为关键生产要素。围绕数据的搜集、加工、分析、挖掘过程中释放出的数据生产力,正在成为驱动经济发展的强大动能。
数据在数字化时代扮演越来越重要的角色,如何发挥数据价值?许文彬表示,《经济学人》杂志提出:“世界最有价值的资源不再是石油,而是数据”。我国正式进入数字经济“红利”大规模释放的时代。近年来,中国数字经济规模保持快速增长,占GDP比重持续上升;预计到2025年,我国数字经济总量将达到32.67万亿元,占GDP比重高达35.8%。此外,数字经济的增速显著高于GDP增速,成为带动经济增长的核心动力。
他认为,一方面,数字经济提供产业进步的新抓手,通过数字技术加速与经济社会各领域深度融合,成为引领经济社会发展的先导力量。数字技术是后金融危机时代推动产业变革升级、促进经济社会转型、培育经济新动能、构筑竞争新优势的重要抓手。
随着互联网的发展以及自身业务的沉淀,各企业拥有了海量的数据,形成了珍贵的企业数据资产。与此同时,用户数据安全问题变得越发重要,企业如何在保护用户隐私数据、符合监管要求前提下,与外部机构融合共享数据资源实现数据增值,成为企业面临的一大问题。
许文彬认为,目前存在三大因素制约发展:一、数据孤岛。企业产生海量的数据,但是各部门、公司、行业等数据孤立严重,相互之间的数据无法流通,无法发挥数据协同价值。二、监管趋严。国家越来越重视隐私安全,出台一系列法律与法规保护数据隐私安全,促进行业可持续发展。三、信任鸿沟。大量的隐私数据泄漏事件让用户愈发担心数据安全性,也提高了企业数据挖掘的成本。
数据应用的技术如何更好地挖掘和解决问题?许文彬认为,首先是数据治理。数据治理也就是数据中台的内容,数据治理包含:数据汇聚、数据开发、数据可视化、数据报表、数据建模等内容,数据治理致力于打通企业内部数据,充分利用内部数据价值。数字化改革之后,很多企业、政府都会有更多的数据,所以,需要打通企业内部数据,包含数据的汇聚、开发、可视化、数据报表、建模等内部的数据打通。
而对于数字经济发展与数据隐私安全矛盾的破局关键在于隐私计算技术。隐私计算串联了整个企业的外部数据,同时,打通了企业内部数据,从而达到数据化最大价值。
随后,许文彬讲解了数据中台和隐私计算的整体内容以及运作方式。
他介绍,数据中台相应的架构,像数据的串联。底层是数据的来源,包括数据库、埋点采集、应用日志、三方数据等数据做一些汇聚。基础设施是大数据基础设施,数据中台包括数据分析平台、数据开放平台、数据湖管理平台、智能决策平台、机器学习平台、数据安全平台等,业务前台包括数据分析、数据风控、用户画像、智能运营、精准营销和反欺诈等
隐私计算也可以接入各种各样的数据,隐私计算架构底层数据源包括表格文件、关系型数据库、大数据平台、图片/图像和文件数据库,再上面是安全加密、计算加速和区块链。区块链主要是串联整个隐私计算的平台。目前主流的三种技术是安全多方计算、联邦学习、TEE这三种方式,这三种技术都是为了服务于具体的场景。再上面包括了联邦中心、数据中心、服务中心和安全监控。整个隐私计算底层都是为了服务整个应用层,应用层有联合查询、集合求交、联合计算、联合统计和联合建模。
许文彬主要介绍了三大平台:一、隐私计算中联合建模平台。该平台提供联邦社区的数据共享与联合建模服务,联邦成员可上传数据,发起合作项目,与多个协作方共同联邦建模,支持模型在线评估与推理。二、安全多方计算平台。该平台提供面向业务的运营与管理服务,可视化配置产品服务接口,支持匿踪查询、联合统计、安全求交等,实现高效业务对接与费用清算服务。三、WeFe开源联邦学习平台。该平台对项目代码进行开源,以开放的姿态拥抱数据安全生态建设,开源项目具有免费、透明等优势,有利于扩大可信计算领域的交流和影响力,进一步助力数据共享。
随后,许文彬详细介绍了三个案例:
案例一:匿踪查询。汇立银行在不泄漏客户信息的情况下完成黑名单风险排查,提高风控效率。汇立银行无法查询到目标对象以外的数据,而Welend无法得出具体查询的客户ID,汇立银行和Welend两家数据不能交互,因此天冕科技用OT的协议的方案,保障保护了银行的客户信息。
案例二:联合建模。某头部互金公司在数据不出库情况下与第三方数据服务实现建模,增加了模型特征变量,提升了模型效果。该公司进行存量沉默用户激活营销的建模时因自有数据特征少,模型效果差,同时无法直接使用第三方数据,存在数据泄漏风险。而通过联邦学习平台与第三方数据服务商实现线上联合建模,KS提升11%,营销收入每期增加68万元。
案例三:数据开发共享。借助联邦学习、安全多方计算、零知识证明等隐私计算技术,让数据开放共享,可以实现政府和市场两方面优势互补,充分服务于城市公共服务和经济发展。政府作为权威数据的提供机构,希望借助数字经济能够更好的发挥数据价值。企业作为数据的需求方,可借助外部数据,提升数据字运营效率,让数据产生更多的商业价值。而隐私计算基数,为政企数据开放共享提供可行的数据安全解决方案。
最后,许文彬总结,隐私计算不仅仅只是一项安全软件,隐私计算必须与数据治理结合,挖掘企业内部和企业外部的数据价值,并且应用于业务系统之上,这样才能更好的发挥数据价值,助力数字经济发展。
许文彬,10余年IT科研经验,现任天冕科技隐私计算技术负责人,曾就职于顺丰、国采支付、腾邦国际等国内大型企业。
天冕科技是WeLab汇立集团旗下一站式科技服务商,依托集团多年来年技术的输出与积累,以大数据分析、人工智能、机器学习等核心技术为基础,自主研发了涵盖智能信贷风控服务、系统平台服务、数据中台以及联邦学习平台等在内的产品,助力合作机构降低运营成本,提升服务效率。
↓↓↓ 点击【阅读原文】,回顾本次论坛!