4月27日,由PCview隐私计算研究院主办的「数据隐领未来·隐私计算应用与发展论坛」在线上举行,本次论坛以“数据隐领未来”为主题,秉持共建数据生态的初心,描绘隐私计算赋能数字化转型、助力数字经济的未来蓝图。
翼方健数首席科学家张霖涛作为嘉宾出席此次论坛,并围绕“数据原生时代的IT新基建:「数据与计算互联网」”进行分享。

1
IoDC——数据原生时代的IT新基建
什么是数据原生?
张霖涛表示,我们现在一直在从“数据——知识——智慧”的价值生产链条上进行迭代,这实际上处理的是数据的事情,每一个节点上产生数据,进而实现自我感知、自我运行。数据原生不同于过去依靠人类的知识进行决策,不同于过去数据作为数字排放,而是能够生产人类认知之外的新知识。未来在数据原生时代,实际上是数据先行,节点“即感即知”,数据的产生、存储、分析、决策,均在节点完成。
因此在数据原生时代,需要构建新一代的IT基础设施来应对各种挑战,这也就是翼方健数提出基于隐私安全计算的“数据与计算互联网”。
张霖涛认为,节点需要具备算力、平台、服务、算法等,而数据价值的完整实现均可在这个网络中的每一个节点完成。但光有这些是不够支撑当下及未来对智能化的需求,还需要把节点连接起来。在连接过程中需要将数据、算法和算力进行资产化,这是运行数据与计算互联网的前提。

“在新的数据原生时代,我们能够帮助数据实现数据价值,让每一个节点能够从中获利,在这样一个生态系统中,需要通过商业价值来促进数据所有者,数据使用者和数据服务者之间的协作运行。”2
翼方健数:聚焦“两大基石”构建IoDC网络
那么如何在数据原生时代构建IoDC网络呢?翼方健数用实践给出了答案。
一方面,依托于自主研发的隐私安全计算平台翼数坊XDP,进行数据安全存储、发现汇聚、计算资源调度及隐私计算技术,能够从数据中获取价值,实现数据要素全生命周期的管理和流通。
另一方面,提供一套贯穿数据全价值链条的端到端解决方案。用户并不需要原始数据,需要的是最后数据产生的价值。为了获取这些价值,需要有知识图谱,人工智能,统计分析等数据处理能力。
通过翼数坊XDP平台及其全栈式技术矩阵帮助更多数据实现落地应用;有了落地应用的反馈,平台才能够进行迭代升级,让其更加适应数据价值抽取的目的,形成一系列针对不同行业应用场景的智能应用。两部分相辅相成,平台是实现智能应用的基础;智能应用帮助IT基础设施得以进步和完善,这是建设IoDC网络的两大基石。除了自主研发的数据服务以外,翼方健数通过强有力的生态能力,与端到端全链路过程中不同的数据服务方,AI公司形成了互补和双赢的局面。

张霖涛以翼方健数的“起点行业”——医疗健康行业进行了举例说明。
目前,我国的医疗行业数据分布较为分散,具有很强的私密性。当我们想要把这些数据用起来的时候,一定要把它们统一在一个通用数据模型中,用一种能够互相交互的语言把这些数据连接在一起,形成一个虚拟统一的数据资产。
之后,平台上可以建设和引入很多人工智能模型,比如健康质量管理模型、卫生经济学模型、诊疗合理性模型、知识库、知识图谱等,最终可以服务到个人,做医疗健康管理和疾病预防;经济学的模型则可以服务于医疗保险;诊疗模型则可以用来帮助医院做辅助诊疗,帮助区域实现智能分级诊疗;医药模型可以做真实世界研究、靶点发现;一些传染病动力学模型可以做传染病多点触发监测工作等,但这一系列的价值体现都在基于共同的数据资产的前提下。3
数据原生时代的全栈IT技术矩阵
张霖涛分享了翼方健数提供的应对数据原生 IT 基础设施所有挑战的全栈完备技术矩阵,以及自主研发的隐私安全计算平台翼数坊XDP如何实现数据价值流通。

该平台是一个分层的结构,底下是文件系统,以及区块链的支持XLedger;中间的计算调度引擎叫XDP Execution Engine,上面有各种隐私安全计算的技术;再上面有各种各样应用的框架,最后还有网络的控制让数据进出平台能够受到控制,能够满足整个周期数据的管理。
再来看翼数坊XDP中的几个组成部分。Daas Engnie(XDaaS)是为IoDC打造的数据发现和整合的模块,能提供可扩展的主数据和数据组织方式,将多源数据纳入统一的数据模型之下,实现数据源间的有效融合。同时,提供跨平台分布式高效的数据探查能力,为后续应用打造坚实的数据基础,采用差分隐私、加密查询等方式,保护原始数据安全,防止用户利用查询结果反推原始数据,并在数据融合过程中实现cell级别的来源追踪,并提供细粒度的授权模式,进一步保护对敏感数据的使用。
XDP Execution Engine(XEE)则是为IoDC定制的计算资源调度与适配的引擎,可以适配多种底层计算基础设施,并基于浏览器的多种交互方式,提供多种极端模式,使平台应用可无感调度弹性云资源及超算算力,从而统筹管理IoDC下全网计算资源,结合XFS提供跨节点计算调度能力,使“东数西算”成为可能。
过去几年,翼方健数还为IoDC定制了隐私计算引擎,包括自主研发的安全沙箱、可信执行环境、密文计算框架和联邦学习的框架等,并计划陆续公布相关细节,有些项目也将作为开源项目进行共享。
此外,翼方健数也开发了很多前端和后端的工具,比如说具备不少城市级的数据处理经验的数据治理工具DataWand等,在保证数据安全的前提下,提高数据治理的效率。4
实践派的进击之路
目前,翼方健数已经在医疗健康、政务、营销、科学、金融保险等多个行业进行了超过 60 个XDP部署并实现应用价值。
张霖涛列举了城市级健康医疗数据平台、头部三甲医院通过院内数据要素化,进行数据驱动的智能临床应用和临床研究,实现未来智慧医院的数据价值释放。
在医药领域分享了一个“创新生物医药生态系统”,是典型的数据和模型双方协作共享的同时确保其隐私安全的保护。数据和模型的所有者在平台内互相可用不可见,进行授权协作。
同样在人工智能领域的应用,张霖涛还提到了AI Validation的能力验证平台。例如一个招标方想要寻找一个视频识别的AI厂商,如何遴选?大部分来应标的AI视频企业都表示可以满足需求,但如何在不分享原始可能涵盖一些涉及到隐私的视频的情况下,真实考察出企业鉴别能力的高低呢?使用AI验证平台后,需求方可以将视频数据传到平台上,AI公司们接入这个平台去进行“考核”,最终凭借硬实力来获得项目资格。从而既保护了需求方的数据,也保护了AI企业的模型,最终得到了双方都满意的结果。
近年来,翼方健数基于隐私安全计算和人工智能等技术,让不同数据源通过应用方式进行打通,释放海量数据的价值和活力。受大数据融合应用和隐私保护的双重需求驱动,目前,翼方健数正在多地进行模式复刻与规划。通过持续迭代,实现从单体平台、平台联盟,到已初步成功实现区域IoDC。翼方健数希望在数据原生时代,构建新一代IT新基建,跑出数据价值释放的最佳实践。
翼方健数(BaseBit.ai)是“数据和计算互联网(IoDC ,Internet of Data and Computing)”的先行者,是一家专注大数据、人工智能和隐私安全计算的高科技公司,有“隐私计算四小龙”之称。翼方健数总部位于上海,在北京、厦门、深圳、香港、宜昌、成都等地都设有办事处。
翼方健数(BaseBit.ai)旨在通过核心技术“隐私安全计算”,实现数据可用不可见,不分享原始数据,输出数据价值,打造数据生态,搭建数据要素与数据价值间的桥梁。降低数据利用门槛,推动智能化应用的进步。以隐私安全计算为根,为政务、医疗、金融、营销等行业的数据资产提供安全计算和应用开放赋能,解决方案覆盖区域大数据应用开放平台、科研平台、生信分析平台、辅助决策、电子病历质量控制等。相关产品解决方案已应用在首批国家健康医疗大数据试点城市厦门、宜昌、健康医疗大数据国家研究院、香港科技园、国内著名三甲医院等。
翼方健数是中国通信标准化协会大数据技术标准推进委员会全权成员单位,已参与多项隐私计算国家标准制定。翼方健数成为在工业化和信息化部相关司局的指导和支持下,由中国信息通讯研究院牵头成立的“隐私计算联盟”初创成员。是中国信通院“医疗科技安全实验室”成员单位,提案并起草2021年医疗健康数据流通标准。