数据价值在于数据服务
从事数据治理工作的朋友经常会面临工作价值的追问和思考。数据治理属于我们数据团队内部的事情,不管多好、多复杂、多有挑战,都是分内之事。
工作的价值在于外界的评价,也就被外界需要和使用,也就是数据服务。数据服务的主要方式包括以下八种。
数据集
数据的集合通常是表格的形式。数据集的服务就是通过数据库批量导出部分数据明细,并提供给数据需求方。
优势是不需要太多基础设施投入,也不需要太多的技术积累。
不足是,数据需求方会有倾向多要数据,减少审批的过程,同时提供的数据不再受控,对于数据后续真实的使用也了解有限。
API接口
预先设计好函数,对外提供服务接口能力。对于需求方而言,接口具备体量轻、使用灵活的优点;对于我们而言,可控性增强。
不足是需要技术积累,尤其是开发能力的积累,同时也会面临数据团队和应用开发团队的分工冲突。
目前很多数据治理工具已经包含了类似的能力,让数据分析人员拥有了直接提供数据接口的能力。
阿里云 大数据开发治理平台 DataWorks
基本逻辑
操作向导示例
电信云 数据治理中心 DataArts Studio
数据服务架构图
数据报表
根据规定的业务逻辑,通过简单的统计处理,以数据集合或者图形的方式将结果展现出来。
数据看板
数据看板
数据看板
数据报告
对数据进行深度加工,并基于数据分析,加上文字或图表解释,将数据反映出的规律和问题展示出来。数据报告提供的是一种知识。
这种方式的优点是能直接给客户提供咨询服务,同时面临的挑战是不光需要懂数据,还需要懂客户的问题和业务。
数掘标签
对一组数据的基本特性或共同特性的提炼。在数据挖掘或数据分析过程中可以通过数据标签直接获取符合相应特性的数据集。
数据订阅
通过统一、开放的效据订阅通道,使用户高效获取订阅对象的实时增量数据。其中包含业务异步解耦、异构数据源的数据实时同步,以及包括复杂ETL技术的数据实时同步等多种应用场景。
数据订阅的交付方式可以是邮件,也可以通过手机app来推送,从而实现【数据找人】的效果。
数据组件
具备特定数据处理逻辑的工具,可以根据需要直接处理数据或者作为数据应用的调用对象。
供应用嵌入报表
数据应用。
数据应用是数据服务的高级形式。数据应用将数据通过功能、程序处理后,通过自身的界面展示处理,其可以实现复杂的数据处理和多样化的界面呈现。比如我们熟悉的企查查。