“高级业务分析的必由之路”——从Quick LODs说起

喜乐君 Tableau Zen Master,官方Partner。开启2021年“Tableau深度系列”— —— —— —

喜乐君按:以Fixed LOD为代表的“狭义LOD表达式”,是Tableau敏捷分析皇冠之顶最灿烂的珍珠;借此,业务用户可自助完成客户RFM分析、购物篮连带分析、产品动销率分析等深度场景,因此是深入业务探索数据价值的关键通道。2021.1版本的Quick LODs进一步简化了创建方式,为业务用户打开了一扇更好了解LOD的窗户,本文从这个小功能开始,尝试全面介绍“狭义LOD表达式”最有魅力的身影。

在2020.1的新版本中,Tableau推出了“Quick LODs”(快捷LODs)的新功能,很多人会耳目一新,“哇,这么好玩!”同时也会有想,“咦,它是做什么的?”这里可以先用一个动画来展示它的操作(注意拖拽度量字段到维度上时,需要配合Ctrl/Command键)。

(上图来自官方网站; 此处应该有视频:参见公众号原文

从上面的动画可以看出,只需要简单的拖曳动作,就可以创建一个FIXED LOD表达式,它是“指定某个维度字段的度量聚合”,我也把这个过程称之为“在特定层次完成聚合” (aggregate at a fixed level of detail)
严格的说,“quick LODs”不是一个新功能,而是使强大的“狭义LOD表达式”功能发挥到极致的“功能外挂”。在这里,我假设要把这个功能分享给学习Tableau刚刚三个月的新用户,因此就要循序渐进地阐述这个绝妙设计背后的来龙去脉。

☆ 1、何为LOD? ☆

要说FIXED LOD,就要先说LOD是何方神圣;要说LOD,这又涉及到字段分类和问题分析。在《数据可视化分析:Tableau原理与实践》一书中(2020年第二次印刷之后的版本),我把所有的问题结构分为了“样本范围、问题描述和问题答案”三个部分,分别对应Tableau中的筛选器(filter)、维度(dimension)和聚合(aggregation)。如下图所示:

对于分析而言,无限的问题来源于有限字段的组合。我们听到任何一个问题,首先,要确认在哪个范围内问问题(筛选条件),是“总公司”还是“某个部门”,是多年还是本年等等;其次,要确认在哪个层面问问题(LOD ),是关于各年度的分析呢,还是关于各细分市场;再者,用哪个字段回答领导的问题,是销售额总和呢,还是平均利润率(聚合)。
三个问题结束,才能完整了解领导的问题。 这三个角度的关键词各不相同,其中最关键的“问题描述”都是用分类字段来描述,比如类别、日期、区域等等,Tableau中称之为“维度”。关于维度和度量的分类,是Tableau中至关重要的原理,也是本文解读的关键起点——我在书中称之为“字段的第一分类”。“维度”描述的是字段属性,“维度字段组合”描述问题是什么。多个维度构成问题的主干,它代表数据聚合的高度,我们称之为“问题的层次”或者“问题的详细级别”,即Level of detail,简称LOD。比如,“各年度、各类别 的 销售额总和”,以“的”为分界,左侧的“年度*类别”代表这个问题的层次、问题的LOD、问题的详细级别。同理,“年度”是问题“各年度的销售额总和” 的层次,而“客户”是问题“各客户的销售额与利润分布”的层次。

在只有一个层次的简单问题中,维度的组合就是这个问题的层次、详细级别、LOD,它是聚合的依据。建立了这样的LOD即“问题层次”的理解,就已经理解了Tableau的关键原理。接下来的FIXED LOD,就是建立在上面的问题而来的。

  2、为什么要FIXED LOD 

  FIXED LOD即“指定层次”,不过这只是完整语法的一部分。完整的FIXED LOD是“指定层次、完成聚合”,在语法中,通过冒号左右分开,外面用大括号表示语法规则。如图所示。

问题就来了,既然问题中的维度就是问题聚合所在的层次,直接拖入视图不就完了吗,为什么还要用FIXED指定呢?
为此,必须清晰地区分视图的维度LOD和这里FIXED LOD的区别:视图中可以直接拖入的维度字段,是显性的主视图的层次(LOD),而FIXED LOD是在当前视图基础上,间接引用的另一个问题层次的聚合。因此,FIXED LOD的含义可以更加全面的理解为:在当前视图层次(LOD)中,引用另一个层次的聚合(fixed another lod)当前视图的层次可以通过维度直接加入,引用的另一个层次和视图必然不同,因此必须预先指定层次完成聚合。这里可以展示一个最为经典的案例:各年度的销售额趋势,及其背后的客户矩阵分布。
如下图所示,左下角是“各年度的销售额总和”主视图,要在这个视图中引用“每个客户的首次订单日期”作为客户矩阵,就是在主视图“年度”层次之外,单独引用另一个层次的聚合(another LOD是客户,聚合是最小订单日期)。之后以年为单独标记为颜色,就可以看出看到每年的销售额在“客户矩阵”层面的构成——我称之为结构性分析。

因此,FIXED LOD是“在主视图层次、指定另一个层次、完成预先聚合”。此乃要害,此乃原理。这里,我也可以用一个简单的动画来展示这个过程。

“大数据的重要特征是关心样本特征,而不关心个体差异”,因此我们要量化每个客户的行为指标,比如购买频次、累计贡献、获客日期,而默认不关心指标值背后的客户是谁。我通常把这个过程称之为“为客户打属性标签”。

举个例子,分析“不同购买频次 的 客户数量”。

问题的层次、LOD、维度是“购买频次”,问题答案、聚合是“客户不同计数”;关键在于,“购买频次”是每个客户层次的聚合,是独立于当前视图层次、又不在数据表行级别层次上的。因此,要预先于视图做聚合,这就是Fixed LOD的典型场景。

同理,其他基于客户层次的指标可以预先聚合,之后作为图形的维度或者度量随时拖拽就好,典型的有: 

  • R:最后一次购买的距今间隔
  • F:每个客户的购买频次
  • M:每个客户的累计贡献
  • L:每个客户的生命周期
  • R2:每个客户的第二次购买日期

作为敏捷BI工具,可以一次性写完大部分的指标计算,并拖拽到左侧保存下来反复使用。关键就是Fixed ‘客户名称’,因为“客户名称”就是这里要指定的LOD层次。如下图所示。

有了这些指标,就可以通过数据桶和直方图完成分布,使用颜色在销售额趋势中增加结构分析。这里完整讲解一下“不同购买频次的客户数量”,如下:

(此处应该有视频:参见公众号原文

Tableau的Fixed LOD已经是不能再简单的优雅,正因为此,它也为复杂的业务分析创造了更多的空间,比如销售中愁煞无数人的“动态购物篮分析”、“各季度新客户在之后各季度的留存分析”,“每日的新客户增长率”、“各地区的客户购买力分析”等各种深入场景。在《数据可视化分析》第十章10.8.2小节,介绍了“购物篮关联分析”实例,解释了如何在“样本范围”中使用高级计算。

至此,本文借助Quick LODs功能解释了Fixed LOD的主要应用场景(在主视图中引用另一个层次),并简要介绍了最典型的应用场景:客户的RFM_L分析。

————————

后续主题:

1、广义LOD表达式与狭义LOD表达式
2、业务洞察:结构化分析的四种情形
3、可视化问题类型与增强分析的路径
4…………
————————


喜乐君 /中观大数据科技|产品、咨询
Tableau Partner、Tableau Zen Master
《数据可视化分析:Tableau原理与实践》(202007)作者,即将出版新书《业务可视化分析:从问题到图形的Tableau方法》(202106)

数据可视化分析:Tableau原理与实践(全彩)(博文视点出品)

发布者:喜乐君

喜乐君 | Tableau Partner,Tableau Desktop and Server QA Certification

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Google photo

您正在使用您的 Google 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s

%d 博主赞过: