此前我把LOD表达式、表计算和集动作三大功能列为Tableau“三剑客”,分析师能掌握此三般武器,如同降龙十八掌之于乔峰、凌波微步之于段誉、北冥神功之于虚竹,在实战中必能日渐纯熟,逐步登上可视化分析的巅峰。

而在我的博客,最受欢迎的也是“Tableau LOD系列”,最早的博客始于2017年自学Tableau,之后逐步扩展,言语赘述最后竟然陆续出了六集。因此我也认识了很多学习Tableau的高手和新手,很多人说“这是我看到的最全面的LOD说明文件”、“帮助我理清了LOD的思路”,但是我也深知因为是陆续而写,前后水平不一,此后修订多有慌乱,所以很多重叠的部分。以至于后来在Tableau官方社区发布的文章也有几处言辞笔误。

屏幕快照 2019-09-16 上午8.54.02.png

 

一、视频的缘起与经过

很多人期待我能重写LOD教程,我也多次尝试,最后发现“文辞很难系统”,想要完全跳出来昨日的框架更是极为难事。于是索性想借助视频课程完全重新整理,于是就有了视频课程:

「Tableau高级分析:广义LOD表达式」 (Udemy)

这个系列课程的第一部分,前后耗尽了清明节三天时间,6小时准备ppt框架,2小时制作配图,2小时的录制,2小时裁剪,2小时准备Tableau练习文档,2小时转码上传,加上查询中英文文档等各项准备和整理,三天除了间歇读《楞伽经》休息,其余时间皆在Tableau。

临近十一国庆,我用用了完整的两天时间,录制了最具有代表性的“15大详细级别表达式”,期间有很多的新方法,比去年的思路更加轻松,同时多处附加了集动作、表计算等的解决方案。

IMG_0621.PNG

当然,虽然已经上传,但是事后发现有几个ppt页面有笔误之处,还需要再重新编辑视频重新上传,大约还要半天时间。要认真一点完成一件事情,真是殊为不易。别人过节我学习是易事,难在做出来还能有人喜欢,就需要很高的标准了。

【201910】十一期间,我重新录制了前面的三段视频,并且上传了10大表计算的案例过程。

 

二、整体的框架说明与LOD的重要性

我直接写好了五个部分的框架,按照此框架循序渐进,直抵龙宫;除了语法方面的调整,基本是按照这个思路在前进。但是最早还没有“广义LOD”和“狭义LOD”的明确说法,后来发现容易造成混淆,于是区分了二者,避免只想学习Fixed include exclude LOD表达式的人感觉框架太大,而想完整了解来龙去脉的人又感觉语义混杂。

屏幕快照 2019-09-16 上午8.28.05

于是,我在讲解什么是LOD(level of detail)时,就逐步开始引入“广义LOD表达式”的概念。我希望通过讲解lod,能帮助业务用户了解分析的过程、LOD在分析中的位置,于是有了下面的内容。

屏幕快照 2019-09-16 上午8.32.41.png

最后一天做了一个完整的总结,期间突然心中冒出来一句话,我非常兴奋,于是单独做了一页并加了几句说明,可以视为第一部分“什么是LOD”的关键——

“理解LOD是从Excel到Tableau的本质性跳跃”。

为什么?前几天在一家上市公司做Tableau的商务沟通,SAP负责人特意希望我通过培训劝告业务用户不要凡事都去看明细数据、校对每一条的真假,他们的内心还停留在较低的数据level层面,所以这几天一直在想这个问题。这句话可以是对这个问题的完美回应——当我们开始深谙于大数据的分析,感受从数据和信息中提取知识和洞见的兴奋时,我们就会自然而然的放下对明细数据准确性的过分偏执

屏幕快照 2019-09-16 上午7.17.31

 

三、广义LOD的精髓:三类六种的框架

此前我在博客中说,只有三种LOD,分别是行级别、视图级别和表计算级别。言之凿凿,其实言语道断。

深入经藏智慧如海,深入Tableau亦然。在上面三类之外,还有一些隐含的基于分析和业务的LOD,因此我把它们和表计算统称之为“非视图级别(聚合)”,然后进一步分为表计算和狭义的LODs。于是形成了三类六种的框架。

这个框架的好处在于,我可以从行级别非聚合开始循序渐进,然后讲解视图的聚合,以二者为跳板,然后分析何时用表计算、何时用狭义LODs,这样把Tableau的计算完整的囊括其中,为之后非常重要的话题留下铺垫——“如何选择计算”,这是理解lod表达式之后的应用篇。

屏幕快照 2019-09-15 下午6.57.07

四、以应用作为练习

「update」临近国庆,更新了15大详细级别表达式的完整过程。一个艰难的过程,不过确实比我之前的思路更加清晰,而且介绍了一些替代的方法。比如:

  • 15之11题,使用表计算会更容易完成,而非使用LOD表达式;
  • 15之14题,比例刷的问题,在集动作中有单独的讲述,使用集动作,效果更好,不需要计算,仅需要创建一个“集”就好了,超级方便。

并且,我在讲解15大详细级别表达式时,使用了一个自以为更加清晰的框架“四步骤+层次模型”,用来剖析问题的过程,和理解数据的逻辑关系。这是官方文档中没有的,是基于业务的个人经验和分析实践整理的部分——这一部分,也会作为我明年Tableau图书的重要板块深入解读。 比如下面的一个视频demo:

屏幕快照 2019-09-26 上午8.39.25.png

大部分的案例,我都用了这个逻辑,因此新人几乎可以仅仅以我学习Tableau不及一半的时间成本,就能更快的理解整个过程。其中有几个案例都是不同的场景:

  • 有把fixed LOD及其衍生字段作为筛选器的(在周的leve实现相同日期同比)
  • 有把fixed LOD完全用了决定视图详细级别的,完全没有默认字段
  • 有使用exclude LOD制作参考线的,超越当前视图的维度限制
  • 在保留筛选器的同时,实现LOD计算。

 

五、使用狭义LOD的误区

1、“在手里拿着锤子的人看来,到处都是钉子。”

千万不要因为学习了LOD的强大,就想要用它来解决所有问题!其实很多时候,使用表计算、集动作会更方便快捷。我这几天偶然发现官方九月发布过一篇文章,使用lod做参考线,其中各种嵌套lod的用法,我自己看了都眼花缭乱,没敢亲自尝试。只怕其他人看了,更是对lod心生畏惧,这恰恰不是我想看到的。

我希望你能在“恰当的时候,选择恰当的计算方法”,这也是为什么我讲“广义LOD”,而非只说三类狭义的语法。

 

2、使用即席计算,保持你的思维连贯性

不要因为官方的demo中有大量的计算字段,就上来照着写,这是不对的。更重要的是想清楚问题的思路,然后使用即席计算保持思维的连贯性一气呵成,或者在多次的“猜想与反驳”的试错过程中前进。先做计算字段再取做可视化构建,你就无形中被“IT思维”所绑架。 Tableau最为卓越的一点设计,是从图形(直觉)再计算(逻辑),而非相反,后者是很多传统BI的思路,甚至体现在power BI的图形化思路中,这也是为什么很多产品动辄说自己上百个图形的原因。

大家看我的15大详细级别表达式案例解读视频,基本是边讲边拖拽生成图形,在图形中验证假设,极少先在左侧面板写字段。当你确定性的知道这个临时字段有用,把它拖拽到左侧,保存下来,思维的丝滑,尽显其中。

3、不要上来就做计算,甚至是即席计算,你对问题的思考决定了你的前进

我刚开始学习lod极其困难,一是业务背景不了解IT,二是方法不当。我把着力点放在了理解计算字段的前后关系,而不是分析问题本身。所以,我总结了四个步骤,按照这个步骤,你几乎可以把非常难的问题,慢慢分解为看得见的小步骤。

我称之为“大数据分析四步一环”,最关键的第一步是分析问题找到对应的lod,也就是问题中引用了几个层次的数据,之后分别是分析lod、聚合lod对应的数据、聚合结果的可视化展示。

中间两步都是对lod的分析,而从问题到视图的关键,则是这个过程中的一个环:问题中包含维度的相互关系是什么。 这是要害,这是关键!

屏幕快照 2019-09-30 上午8.57.19.png

我在15大详细级别表达式中,基本都贯彻了这个思路。掌握这个思路,价值几千上万,是毫无问题的。近期我把LOD的基本最重要的建议也录制成为视频,加入udemy的阶段总结中。

聪明的人善于把复杂的事情简单化,只有愚蠢的人才会把简单的事情复杂化。”

 

十一期间,更新表计算的内容,形成完整的高级分析。

 

欢迎观看我的Udemy——「高级LOD表达式」视频,或者扫码进入预览。

屏幕快照 2019-09-16 上午8.45.25
Tableau 广义LOD相对论

 

Sep 16, 2019
Sep 30, 2019 udpate
Oct 5, 2019 update TC