详细级别表达式(LOD)是学习Tableau的难点,起初感觉容易,但是随着越来越多的高级分析应用到LOD表达式,你会发现它有各种变化无穷的用法,又容易受外部筛选器、计算影响。上一篇我们介绍了LOD的基础概念、背景知识以及常见用法,这一篇更深一层介绍语法和逻辑——特别是Fixed LOD的三种情形。

理解LOD的关键有三个:

  • 什么是LOD?(详细级别)区分 行级别与视图级别;
  • 理解LOD表达式的功能,与维度、度量的关系;
  • 理解不同类型LOD表达式语法的应用场景

 

一、LOD表达式与视图详细级别

1、何为详细级别(LOD)

首先回顾一下上一篇的重点,什么是LOD?LOD=level of detail,代表数据的详细级别,不同的详细级别,对应不同的数据聚合度和颗粒度。最高的数据颗粒度就是行级别的数据,最低的颗粒度则对应着一个完全聚合的数值;中间的数据颗粒度就是常用的视图可视化详细级别(Viz LOD)。

一般来说,在Tableau中,一个视图对应着一个视图详细级别,比如我们把year、area、profits三个字段加入视图,year和area(维度)决定了详细级别的层次,profits即详细级别上的内容。在主视图详细级别(year*area)之外,我们可以使用LOD表达式,引入另一个详细级别的数据。

关键词:详细级别……增加维度……标记数量增加

在 Tableau 中,我们将主可视化聚合级别称为其“详细级别”……向视图中添加维度来增加标记数量的过程称为设置详细级别。……某些情况下,向视图中添加度量可能会增加视图中标记的数量。但这与更改视图的详细级别不同。

说到这里,我们说一下官方文档中的一句话:“放在(下图方框中)任何位置中的维度和集字段组成视图详细级别。”因为维度和集字段会形成可视化聚合视图。

1 calculations_lod_shelves

更改详细级别,需要增加维度(维度或集字段);而不是度量。

2、LOD的意义与语法逻辑

理解LOD,就要深刻理解官方的介绍,借助详细级别表达式,无需实际将这些维度拖入可视化内容中, 您即可确定在计算中使用的详细级别(即维度)。 您可以独立于可视化详细级别, 定义应以什么详细级别来执行计算。”——不拖拽字段影响视图,又通过LOD表达式背后引用数据。视图是用户看的见的,计算则是隐藏其后的逻辑。

具体而言,三个LOD表达式的使用场景和语法分别如下:

{ [FIXED | INCLUDE | EXCLUDE]  <维度声明>   <聚合表达式>}

  • FIXED | INCLUDE | EXCLUDE 是定界关键字,制定了LOD的范围;
  • <维度声明>,指定聚合表达式要联接到的一个或多个维度。使用逗号分隔各个维度。
  • : 冒号用于分隔维度声明与聚合表达式。
  • <聚合表达式>,聚合表达式是所执行的计算,用于定义目标维度。

二、LOD的语法逻辑

1、include与exclude LOD

include和exclude LOD,是在当前视图的维度基础上,增加一个新维度include把不在视图中的维度引用到视图数据中,但不改变视图本身,或者排除一个已有的视图维度exclude把视图中的维度排除后计算,但不改变视图本身的维度引用。因此Include和exclude LOD是依赖于视图详细级别的增减。我们用下面的图形形象地表示可以看见,从当前视图出发(深绿色箭头),最终的结果又返回到视图显示出来(红色箭头)。

屏幕快照 2019-05-01 上午10.39.44.png

!【增补】最新的图片上,我们增加了两个词:复制和聚合。使用exclude LOD,我们获得的结果标记数量明显会少于视图的颗粒度,因此同一个数据会在多个地方“重复出现”,我们称之为“复制”;而使用 include LOD,我们获得数据标记数量会高于视图颗粒度,也就是视图中只有三行,include LOD可能返回一个10个数据的数组,此时结果默认会聚合,按照视图的详细级别分组、聚合。

2、fixed LOD

Fixed LOD稍微复杂一些,fixed是按照语法中指定的维度(如果不指定维度,则为表范围所有数据,比如{ MIN([profits])}  ),在可视化之前执行数据的聚合,而不引用视图中的任何其他维度。因此,它又分为两种情况,一种是指定的维度生成的详细级别比当前视图详细级别聚合度更高,另一种则是更低。

比如说,我们要看超市中每个细分下各类别的利润,同时希望对比相对于每个细分的差异,这就涉及到两个详细级别:细分*类别,和细分。确定好视图详细级别的维度后,另外的一个详细级别就要用LOD来提供。我们可以使用fixed 指定细分来返回数据,在没有筛选器情况下,它的结果和exclude排除类别是相同的,计算比率也一样,我们可以用上面的图解释原理,下图看效果:

Screen Shot 2019-04-16 at 7.51.41 AM.png

具体来说,fixed的具体场景有几种,

  • 聚合级别比视图级别要高;
  • 聚合级别与视图级别要低;
  • 聚合级别与视图级别无关。

比如说上面的 {fixed [细分]: sum[利润]} ,返回到视图的数据聚合级别比当前视图要高;而如果我们在视图两个维度的基础上,增加指定新的维度,则返回到视图的数据的聚合级别要比视图要低,比如 {fixed [细分], [分类],[商品] : sum[利润]}  。

还有一种常见的情况,比如我要在上面的基础上,增加每个细分中每个客户贡献利润的平均值,我就需要引用在视图中没有的新维度:客户名称。客户层面的详细级别,与视图维度的详细级别(细分*分类)其实是没有关系的。

上面的三种情况,如果要用一个图来表示,可以参考如下图:

Screen Shot 2019-04-16 at 5.06.59 PM

【增补】这里的“复制”和“聚合”含义与include/exclude LOD一致,不过这里需要注意fixed LOD的第三种情形,比如在没有客户的视图中引用了客户字段——一个与视图完全无关的新的详细级别出现了。fixed LOD返回的数组颗粒度,一般都会高于视图详细级别,结果最后会被默认聚合,以便恰当地出现在视图的详细级别上。

 

3、LOD的区别

其一,与视图详细级别的关系

结果就是,fixed LOD返回的聚合结果,聚合度可以比当前视图高,也可以低;而exclude返回的结果聚合度必然比当前视图的详细级别高,include则相反。

详细级别与LOD

LOD表达式并不是一种详细级别,而是在当前视图详细级别增加另外的详细级别聚合的计算语法。它和表计算不同的是,LOD计算是基于数据源的,因此每一个LOD表达式都会从数据源引用一次并计算;而且LOD计算的优先级比表计算要高。

其二,与筛选器的顺序

在之前的数据中,我们都没有做筛选器,下面,我们看一下筛选器对LOD计算的影响。

初学者不能充分的领会LOD表达式,特别是fixed 和 include/ exclude的区别,一个重要的原因是没有清楚它们在整个操作顺序中的位置( the Order of Operations)。关于操作顺序,不妨看一下下图,我用浅色代表筛选器,深色表示维度和表达式等。

筛选器和操作顺序.png

这个筛选器和操作顺序里,关键是LOD表达式的相对位置——Fixed LOD表达式在维度筛选器之前,而include /exclude LOD在维度筛选器之后。

其三,结果作为维度还是度量

Fixed因为不依赖于视图的维度,因此可以作为维度使用,也可以作为度量使用;而include和exclude只能作为度量使用。

 

四、注意

  • {}大括号代表详细级别表达式,也代表数组的概念
  • 区分筛选器和筛选。

 

完整的LOD学习,欢迎观看2019年09最新的视频课程,包含了全新的理解和框架:

 

2017年8月21日 修改V2.0
2017年8月23日 修改V2.2
8 May 2018 小修小补 V2.3
21 Oct 2018 修订
May 1, 2019 修改include/exclude/fixed图片