在大数据时代,企业数据资产的生产和消费,实际现状大概是这样的。一方面,每个业务部门都产生并存储了大量的数据。这些数据存储在不同的系统中。每个业务部门都是数据的生产者。另外一方面,每个业务部门都有使用数据来帮助进行更智能决策,每个业务部门也都是数据的消费者。作为数据的消费者们,希望可以自由地消费全公司的数据资产。因为只有联合了多个相关部门的数据进行分析,才能够得到更为有用的结果。那么我们怎么样一方面能够让数据更好更快更方便的在全公司范围内被发现被消费,另外一方面又能够做到数据的所有使用和访问都需要授权和监督?2022亚马逊云科技re:Invent全球大会上发布了一个新服务Amazon DataZone。Amazon DataZone为数据治理提供了一套可行的思路:敏捷的,分散式的数据治理。具体来说,Amazon DataZone提供了一个平台和对应的工具,方便数据的生产者和消费者建立连接,让消费者对生产者的数据进行使用。在实际使用过程中,并不需要全公司全方位进行数据治理。只需要找到一个生产者和一个消费者,这一对生产者和消费者就可以先创建项目和API,让消费者把数据在监管的情况下先用起来。下图展示了Amazon DataZone的主要组件。这样一来,就不需要有一个跨部门全公司范围内全方位的治理了。生产者依然是数据的拥有者,消费者依然是向生产者请求数据的使用。生产者和消费者所对应的信息被聚集到Amazon DataZone这个统一的平台下。Amazon DataZone的另外一个重要的功能是提供了一个统一的门户,潜在的数据消费者可以很容易的在这里对所有在Amazon DataZone上的数据资产进行搜索。下图展示了Amazon DataZone的数据门户。继续上面这个例子。如果有更多团队想使用已有的数据资产,他只需要在Amazon DataZone的门户搜索并发现这个数据资产。然后就可以订阅并加入消费者的行列。第三者的使用并不需要生产者再次重复之前创立数据资产和对应API的所有步骤了。下图展示了潜在数据消费者,如何利用数据门户进行搜索。如果说Amazon DataZone提供的功能让一对生产者和消费者建立连接,是一个企业内部的两个点被连成了一条线的话,那么第三者通过Amazon DataZone发现数据资产并使用,则可以让线变成网。用的时间就来,不断有生产者和消费者加入,不断有额外的消费者建立额外的链接,数据治理也就越来越成规模化发展了。这就是敏捷的,分散式的数据治理。在这里,Amazon DataZone扮演了重要角色。一方面,Amazon DataZone只是一个数据资产发布和管理的平台,实际对数据资产进行管理的依然是数据的生产者。另外一方面,Amazon DataZone事实上聚集了越来越多的数据资产的信息。同时Amazon DataZone也提供了让第三方潜在数据消费者去发现这些数据资产,从而能够使用这些数据资产的能力。这两方面能力的结合,是Amazon DataZone解决数据治理过程中万里长征不知道从何开始,也不知道怎么样完成的核心手段。Amazon DataZone通过这些能力,为企业敏捷的,分散式的数据治理提供了一个平台。在这个平台下,企业可以通过敏捷的增量模式,逐渐将公司的所有数据资产在一个统一的平台下实现数据治理,让数据治理的万里长征真正成功。Amazon DataZone这个服务,值得每个需要数据治理的企业去尝试。对于企业来说,数据可能来源于数据仓库、数据湖、流数据、关系数据库、第三方系统等多个地方,亚马逊云科技提供了一个叫Amazon Glue工具,可以轻松地发现、集成来自多个数据源的数据,并且可以对数据进行提取、转换、加载(ETL)。用户可以按照自己的需求,把各个数据源的数据进行编目,形成数据目录(Data Catalog)。有了数据目录和组织结构做基础,每个部门就可以根据需要来创建属于自己的业务术语,元数据,从而建立自己的数据资产。数据资产一旦发布出去(当然,需要设置好权限),别人就可以查询了,Amazon DataZone 专门提供了一个门户(Portal)对数据资产进行查询,非常方便。利用这种方式,可以迅速地对接生产者和消费者,把数据资产创建起来,马上投入使用,从而实现快速响应业务需求,应对市场变化。沉淀下来的数据资产还可以继续被别的消费者使用,随着这样的数据资产越来越多,大家都看到了业务价值,数据治理就会走上正轨。PS.如果您想了解更多2022亚马逊云科技re:Invent全球大会相关资讯,12月20日举办INNOVATE在线大会不容错过。为您剖析re:Invent 2022的最新发布以及全球观点与实践,深度技术详解端到端的数据战略及未来基础架构。(点击阅读原文观看回放)来源:谈数据精彩推荐大佬观点中电金信-胡静 |领雁科技-陈丽琴 | 普强信息-张伟 | 腾讯安全-林臣焱 | 星环科技-李梓梁 | 数美科技-王正 | AnyChat-师伟 | 中电金信-高雪梅 | Convertlab-程龙及团队洞见科技-李博 | 富数科技-吴海斌 | 光之树科技-张佳辰 | 翼方健数-张霖涛 | 融安数科-李登峰 | 天冕科技-许文彬 | 熠智科技-范学鹏 | DataTrust-张子良及团队 | 富数科技-崔如德 | 锘崴科技-薛娟娟 | 云基华海-杨文华 | 数澜科技-蒋梦琴 | 腾讯云-刘江END行业知识交流分享,结识扩展人脉圈层公众号后台回复【数字金融】可受邀加入【金融数字化&金融科技群】本篇文章来源于微信公众号: 数字金融网