详细级别表达式(LOD)是我学习Tableau路上迄今最大的拦路虎,在做零售的会员分析时,我不断地重读官方指南扩展LOD前后的知识,不断练习在试错中改进。在上一篇数据练习的基础上,我想这一篇总结一下理解和应用Tableau之LOD的关键。

我总结,理解LOD的关键有三个:

  • 什么是LOD?(详细级别)区分 行级别与视图级别;
  • 理解LOD表达式的功能,及LOD表达式与维度、度量的关系;
  • 理解不同类型LOD表达式在Tableau操作中的位置

 

一、LOD表达式与视图详细级别

1、何为详细级别(LOD)

首先回顾一下上一篇的重点,什么是LOD?LOD=level of detail,代表数据的详细级别,不同的详细级别,对应不同的数据聚合度和颗粒度。最高的数据颗粒度就是行级别的数据,最低的颗粒度则对应着一个完全聚合的数值;中间的数据颗粒度就是常用的视图可视化详细级别(Viz LOD)。

一般来说,在Tableau中,一个视图对应着一个视图详细级别,比如我们把year、area、profits三个字段加入视图,那么视图的详细级别就是每年每个区域的利润额汇总。在主视图详细级别之外,我们可以使用LOD表达式,引入另一个详细级别的数据。

关键词:详细级别……增加维度……标记数量增加

在 Tableau 中,我们将主可视化聚合级别称为其“详细级别”……向视图中添加维度来增加标记数量的过程称为设置详细级别。……某些情况下,向视图中添加度量可能会增加视图中标记的数量。但这与更改视图的详细级别不同。

说到这里,我们说一下官方帮助中的一句话:“放在(下图方框中)任何位置中的维度和集字段组成视图详细级别。”因为维度和集字段会形成可视化聚合视图。

1 calculations_lod_shelves

更改详细级别,需要增加维度(维度或集字段);而不是度量。

2、LOD的意义与语法逻辑

理解LOD,就要深刻理解官方的介绍,借助详细级别表达式,无需实际将这些维度拖入可视化内容中, 您即可确定在计算中使用的详细级别(即维度)。 您可以独立于可视化详细级别, 定义应以什么详细级别来执行计算。”——不拖拽字段影响视图,又通过LOD表达式背后引用数据。视图是用户看的见的,计算则是隐藏其后的逻辑。

具体而言,三个LOD表达式的使用场景和语法分别如下:

{ [FIXED | INCLUDE | EXCLUDE]  <维度声明>   <聚合表达式>}

  • FIXED | INCLUDE | EXCLUDE 是定界关键字,制定了LOD的范围;
  • <维度声明>,指定聚合表达式要联接到的一个或多个维度。使用逗号分隔各个维度。
  • : 冒号用于分隔维度声明与聚合表达式。
  • <聚合表达式>,聚合表达式是所执行的计算,用于定义目标维度。

FIXED 详细级别表达式使用指定的维度计算值,而不引用视图详细级别,也就是说,不引用视图中的任何其他维度。FIXED 详细级别表达式还会忽略除上下文筛选器、数据源筛选器和数据提取筛选器之外的所有筛选器。

INCLUDE
除了视图中的任何维度之外,INCLUDE 详细级别表达式还将使用指定的维度计算值。
在纳入不在视图中的维度时,INCLUDE 详细级别表达式最有用。

EXCLUDE
EXCLUDE 详细级别表达式从表达式中显式移除维度,也就是说,这些表达式从视图详细级别中去除维度。在排除视图中的维度时,EXCLUDE 详细级别表达式最有用。

 

二、LOD的语法逻辑

1、include与exclude LOD

include和exclude LOD,是在当前视图的维度基础上,增加一个新维度include把不在视图中的维度引用到视图数据中,但不改变视图本身,或者排除一个已有的视图维度exclude把视图中的维度排除后计算,但不改变视图本身的维度引用。因此Include和exclude LOD是依赖于视图详细级别的增减。我们用下面的图形形象地表示可以看见,从当前视图出发(深绿色箭头),最终的结果又返回到视图显示出来(红色箭头)。

Screen Shot 2019-04-16 at 5.29.33 PM

屏幕快照 2017-08-13 下午11.41.13
Screen Shot 2019-04-14 at 7.01.24 PM.png

2、fixed LOD

Fixed LOD稍微复杂一些,fixed是按照语法中指定的维度(如果不指定维度,则为表范围所有数据,比如{ MIN([profits])}  ),在可视化之前执行数据的聚合,而不引用视图中的任何其他维度。因此,它又分为两种情况,一种是指定的维度生成的详细级别比当前视图详细级别聚合度更高,另一种则是更低。

比如说,我们要看超市中每个细分下各类别的利润,同时希望对比相对于每个细分的差异,这就涉及到两个详细级别:细分*类别,和细分。确定好视图详细级别的维度后,另外的一个详细级别就要用LOD来提供。我们可以使用fixed 指定细分来返回数据,在没有筛选器情况下,它的结果和exclude排除类别是相同的,计算比率也一样,我们可以用上面的图解释原理,下图看效果:

Screen Shot 2019-04-16 at 7.51.41 AM.png

具体来说,fixed的具体场景有几种,

  • 聚合级别比视图级别要高;
  • 聚合级别与视图级别要低;
  • 聚合级别与视图级别无关。

比如说上面的 {fixed [细分]: sum[利润]} ,返回到视图的数据聚合级别比当前视图要高;而如果我们在视图两个维度的基础上,增加指定新的维度,则返回到视图的数据的聚合级别要比视图要低,比如 {fixed [细分], [分类],[商品] : sum[利润]}  。

还有一种常见的情况,比如我要在上面的基础上,增加每个细分中每个客户贡献利润的平均值,我就需要引用在视图中没有的新维度:客户名称。客户层面的详细级别,与视图维度的详细级别(细分*分类)其实是没有关系的。

上面的三种情况,如果要用一个图来表示,可以参考如下图:

Screen Shot 2019-04-16 at 5.06.59 PM

屏幕快照 2017-08-13 下午11.34.30.png

3、LOD的区别

其一,与视图详细级别的关系

结果就是,fixed LOD返回的聚合结果,聚合度可以比当前视图高,也可以低;而exclude返回的结果聚合度必然比当前视图的详细级别高,include则相反。

详细级别与LOD

LOD表达式并不是一种详细级别,而是在当前视图详细级别增加另外的详细级别聚合的计算语法。它和表计算不同的是,LOD计算是基于数据源的,因此每一个LOD表达式都会从数据源引用一次并计算;而且LOD计算的优先级比表计算要高。

其二,与筛选器的顺序

在之前的数据中,我们都没有做筛选器,下面,我们看一下筛选器对LOD计算的影响。

初学者不能充分的领会LOD表达式,特别是fixed 和 include/ exclude的区别,一个重要的原因是没有清楚它们在整个操作顺序中的位置( the Order of Operations)。关于操作顺序,不妨看一下下图,我用浅色代表筛选器,深色表示维度和表达式等。

筛选器和操作顺序.png

这个筛选器和操作顺序里,关键是LOD表达式的相对位置——Fixed LOD表达式在维度筛选器之前,而include /exclude LOD在维度筛选器之后。

其三,结果作为维度还是度量

Fixed因为不依赖于视图的维度,因此可以作为维度使用,也可以作为度量使用;而include和exclude只能作为度量使用。

 

四、注意

  • {}大括号代表详细级别表达式,也代表数组的概念,因此,即便在大括号中冒号后面使用了sum等聚合函数,它依然是聚合之后的一个数字,作为数组中的一个数字而非聚合;所以我之前经常出现报错,我误以为大括号后面有一个sum,大括号就是一个聚合值;
  • 区分筛选器和筛选。

 

完整的LOD学习,请按照以下顺序阅读:

  1. 【Tableau】详细级别表达式_从0到1的入门
  2. 【Tableau】详细级别表达式_位置与语法
  3. Tableau|LOD详细级别表达式终极实操
  4. 【Tableau】15大详细级别表达式-深度解读 (5)
2017年8月21日 修改V2.0
2017年8月23日 修改V2.2
8 May 2018 小修小补 V2.3
21 Oct 2018 修订