6月21日下午,由数字金融网主办,RPA中国、LowCode低码时代联合举办的「重塑与变革:数字风控创新应用交流研讨会」在线上成功进行。星环科技金融行业资深架构师李梓梁,作为特邀嘉宾出席此次会议,带来《基于隐私计算与图应用的金融风控业务实践》的主题演讲。
李梓梁表示,隐私计算是数据流通重要的环节。随着互联网的发展,数据越来越多,一些业务发展也需要使用大量机构、跨行业数据,所以在未来各类机构对隐私计算有很大需求。
近些年,各类基于数据安全的法律法规逐步出台,例如《数据安全法》、《个人信息保护法》通过后,保障隐私数据的安全合规使用,成为数据要素流通场景下必须满足的法律要求。因此,数据流通3.0阶段来临,需建设数据流通合规控制与数据交易平台,以实现数据的安全、合规交易,发挥数据要素价值。
他介绍,隐私计算从业务属性划分,包括不敏感、低敏感、较敏感和敏感数据四个等级。四个等级分别包含了不同的数据,D1不敏感数据包含了一些公开的数据,比如天气、船舶、地铁等信息。随着等级不断上升,数据越来越敏感,D4是敏感数据,包含企业交易数据、医院医疗健康信息等。敏感数据在进行传输的时候,是有一个比较高要求的。
星环科技提供的数据流通的平台Navier,通过数据交易门户Datamall和隐私计算平台Sophon P²C来实现交易环境和消费环境的打通。数据供应方可以把数据放到交易门户里,交易方可以在交易门户里面看到数据供应商所提供的数据。双方通过隐私计算对数据进行交互,比如联邦学习、匿踪查询等,通过双方的模型训练、数据查询等形式实现数据流通。
数据要素流通平台 Navier是一个工具平台,这个平台处理数据流通的具体架构,主要包含三层,中间层主要是技术平台,主要是为了完成数据交易这一环节,通过隐私计算的方式进行数据交互。底层密码学协议,最顶层就是数据门户,如数据动态授权、隐私保护下的数据发布和数据共享流程审批。
在数据流通全流程中,数据提供方会提供标准化的数据,这些数据已完成安全审核,接着将数据传给Datamall数据交易门户,在双方供需匹配后,可进入隐私计算平台Sophon P²C实现数据交互,数据提供方、数据使用方各自建立机器学习模型,在隐私计算平台上面进行模型融合。李梓梁介绍,Sophon P²C除了联邦学习外,还提供数据质量评估、多方安全计算、隐私查询、匿踪查询等功能,通过各类隐私计算能力实现不同业务场景下的数据要素流通。
接下来,李梓梁介绍了隐私计算相关案例。星环科技帮助某金融机构实现了基于隐私计算的精准营销,通过将两方金融机构数据融合互补,实现了联邦学习。二者通过隐私计算的方式实现模型的融合,在数据不动模型动的情况下,完成所需的结果补充,实现了营销模型能力的大幅度提升。
另一个案例是基于电水融合的联邦学习模型构建,项目目标是群租房打击,原来通过举报的方式效果比较差,现在通过纵向联邦学习模型融合的方式进行比较好的识别。具体实施是某电网公司作为建模方采用电数据,参与方采用水数据,构建联邦学习模型;通过单独用电模型与电水融合模型的实现效果对比,证明了联邦学习模型的优势。
李梓梁介绍,知识图谱是用图模型来描述知识和建模万物关系的语义网络,知识图谱能够展现实体间的复杂关系,基于知识图谱能够深入分析,并挖掘潜在特征,推断潜在关系,从而辅助业务决策。同时,基于知识图谱和自然语言处理,帮助机器实现理解、
解释和推理的能力,是认知智能的底层支撑。
面对海量数据的存储和处理问题,传统关系数据库的局限性日益明显,当数据达到一定规模时,越来越多的企业意识到图数据库是呈现和查询这些关系数据的最好方式。而理解和分析这些图的能力将成为企业未来最核心的竞争力。
在李梓梁看来,图谱的应用建设上,很多的客户都是在第一阶段。基于可视化的图谱来建设模型和结构,需要业务人员和科技人员进行手工探索。他认为,这种模式对业务人员不是很友好,最好的方式应该是决策引擎的方式。星环科技在传统图谱的基础上进行封装,将图谱进行业务化的建设整合,从而实现知识库和业务线索库的目的。
图谱应用的核心流程,包括图谱构建、标签生成、核心模式挖掘和可视化探查。
1、交互式零代码的图谱构建过程。以业务视角实现简易、高效、明确的图谱构建,通过拖拉拽结构化数据表进行配置即可直接完成实体、关系及属性的抽取,暨通过图谱模式和数据映射的一体化设计,解决了模式在数据出现之后才能确定的痛点。
2、基于业务场景的标签生成机制。一共分为上下分两层,上层指的是已有的机器学习的能力,下层是图谱,图谱里面可以通过一些图计算的能力,来实现一些图指标的构建,把图指标给到机器学习里,去进行一个特征和指标的衍生运算。

3、核心模式挖掘实现业务模型积累。从数据到信息,到知识,到智慧,这是比较完整的一个路径。通过这个路径,可以在很多场景里面构建业务所需要的基于图的模型和规则。比如在对公信贷场景,可以进行信贷资金流向分析和担保圈链分析等。在个人信贷场景,可以实现多头共债和团伙撸贷风险的分析。同时,基于不同的业务场景和不同的业务部门的需求,也可以实现智慧知识地不断积累。
4、图谱探索分析能力实现业务验证。李梓梁表示图谱的最终目的是希望可以依赖图来完成我们的一些分析能力,比如交互式图谱查询、社群探索可视化、时序分析可视化、图统计可视化等。
李梓梁,星环科技金融行业资深架构师,曾为多家金融机构提供数字化、智能化转型提供咨询指导,对于金融风控业务有多年一线咨询、方案、落地实施经验,可为各类金融机构提供高度匹配的专业化解决方案。
星环科技致力于打造企业级大数据基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务,构建明日数据世界。公司以上海为总部,以北京、南京、广州、新加坡为区域总部,在郑州、成都、重庆、济南设有支持中心,同时在深圳、西安等地设有办事机构,并在加拿大设有海外分支机构。
经过多年自主研发,星环科技建立了多个产品系列:一站式大数据基础平台TDH、分布式分析型数据库ArgoDB及交易型数据库KunDB、基于容器的智能数据云平台TDC、大数据开发工具TDS、智能分析工具Sophon和超融合大数据一体机TxData Appliance 等,并拥有多项专利技术。目前公司产品已经在十几个行业应用落地,拥有超过一千家终端用户。
2016年公司成为中国首个进入Gartner数据仓库及数据管理解决方案魔力象限的厂商,且被评为最具前瞻性的远见者;2017年被IDC评为中国大数据市场领导者;2018年星环科技成为12年来全球首个完成TPC-DS测试并通过官方审计的数据库厂商;2020年再次被IDC评为中国大数据管理平台领导者。目前星环科技已完成E轮融资。
公司愿景是成为世界领先的企业级基础软件供应商,为所有的大数据和人工智能应用提供基础平台。致力于开发出一系列自主可控的大数据处理的基础软件,赋能各行各业实现数据全生命周期的管理和应用。