本周的工作已经基本结束,考虑到公司在数据整理和数据治理上的阶段性问题,提供Tableau与sap结合的最佳实践指南。

数据分析可以分 数据连接和整理、 业务问题可视化、 分享和决策 三个阶段。

未命名图片222

一、数据整理的基本原则

1、理解业务和数据结构是最为关键的前提和条件

  • 清晰的知道业务的基本逻辑(长期的积累,暂时不是障碍)
  • 清晰的了解业务逻辑所对应的多个数据库表和字段(这是衔接的关键,也是薄弱点)
  •  业务的最终旅程,会体现在多个层次的数据表中。

比如VBAK代表订单凭证,而VBAP代表物料交付明细,前者的层次高于后者。

使用冰山的模型思考每个数据表对应的主要结构:

  • 最高的聚合,是什么?通常是CEO和总监关心的内容;
  • 最高聚合往下钻取一层、两层,是什么?通常是总监和部门领导关系的内容;
  • 最低的颗粒度字段是什么?IT关心的,也是分析师分析聚合的来源。

2、问题是分析的开始,而非数据

每一个问题,一定对应最有的数据模型结构;

多个具有层次关系的问题,可以使用一个数据模型结构;

前后两个阶段的问题,往往需要数据连接,最容易出现数据匹配错误。

未命名图片444

从问题开始数据的整理,而不能指望建立一个“神奇表”,其中囊括多个分析主题分析所需要的所有数据。——连接的方式取决于分析的目的和角度。

 

3、凡事要追求简单,但是不要过于简单

简单的SQL能让我们的逻辑更加简化,

Desktop的连接可视化,能帮助我们的思路更加清晰。

最佳的匹配是:使用SQL筛选数据,然后使用tableau做业务连接,并能灵活调整。

SQL简单的背后,是难以验证真伪,暗藏陷阱。

 

4、为了共享

  • 通过desktop可以把整理好的数据单独发布到服务器,供其他人或者业务使用
  • 可以单独使用prep和SQL整理 负责需求,Prep的优势是便于验证。
  • Prep Builder可以共享片段,相当于可以反复使用几个流程,从而不断提高分析效率。

未命名图片5555

(附图:选择部分流程,可以另存为文件,或发布到服务器;另一个文件可以插入)

 

结论:

  • 什么时候用SQL?
    • 会用SQL
    • 起点,简化查询过程;
    • 个性化需求,无需移植;
  • 什么时候用Prep? 任意一种场景
    • 不熟悉SQL,
    • 业务流程比较复杂,需要反复的验证
    • 后期频繁修改流程
    • 一个SQL片段,要用在多个场合。

 

 

二、可视化分析的实践

……后续更新

 

 

Jan 10, 2020  某SAP客户之后