【零售】Tableau LOD+TC做客户交叉购买分析(上)2.0更新

【2020年4月更新】【Tableau高级】LOD实例:基于订单的购物篮分析   上文提供了更加精确的购物篮分析方法。 by 喜乐君 //本文已经加入即将出版的《大数据可视化:原理与方法》 今天客户咨询我一个问题,忙完了细细思考,非常值得写一篇小文章梳理其中的逻辑。此类的问题经常被人问及,之前也零散地分享过,终归不够系统,此次尝试说一下相关的业务需求和背后的技术逻辑。 本文阐述一种角度——一次Fixed LOD,加一次TC表计算(合计百分比)。 PS. 复习了一下高中数据并集和交集 😄 Tableau中左右连接Join,两种基本形式是inner Join和outer Join,前者是内连接(并集),后者是外连接(交集),分别用第二个字母来表示,就是A ∩ B(并集), 和A U B (交集)。 一、来自业务的需求说明 在销售领域分析中,有一个特别重要的领域是购买的交叉分析,比如“同时购买多个品类的客户数量”、“购买品类A同时购买品类B的客户占比”、“仅购买一次的客户中,不同品类的分布情况”等等。这些问题一般不会直接计算金额、商品数量等绝对度量的分析,而更偏重于结构性分析,特别是从顾客数量、品类数量、订单数量等高于商品层次的角度。 也就是,交叉分析往往是考察多个维度直接的结构性关系,而非直接深入单个维度的度量比例。 比如我们要查看客户的忠诚度,一个很重要的角度就是查看“不同购买频次下的顾客数量及占比”这样的分析视角。转化一下视角,从下图来看,就是不同品类的交叉情况。后面我们结合超市数据,分析这个图的可视化过程。 二、客户与品类的交叉分析 我们站在销售经理的角度,尝试去分析不同品类的客户购买情况。我们首先可能会做每个分类的客户数量分析及其相关分析,比如购买金额、购买数量及其%占比等。不过,结构性分析的重点是查看另一个维度的对比或者趋势,比如不同年度的客户数量。 1、无关计算的初级可视化 这个时候,我们可以会想把年度作为颜色加入可视化对比(左下图),不过显然,看上去还不错,但是解释起来破费口舌,这说明我们没有很好地表述可视化焦点。重申一下题目“分析不同分类的客户数量在多年的对比趋势”,趋势应该是关键,所以我们更换品类标题和作为颜色标记的年,就会立刻切换图形,考虑到对比的关键是趋势,面积图自然会比条形图更加直观(右下角)。 在这里,我们可以很明显地发现“技术”的客户数量在2019年增速放缓,被“家具”迎头赶上,这也是折线图非常直观的地方。 2、从直观趋势到内部结构性分析 不过,上面的图形还是停留在初级的分析层面,稍微深一点的分析视角,我们需要从宏观的多年对比回到当下,比如分析2019年的内部结构问题,这样年度就不再是值得关心的焦点,重点是结构。依然从客户和类别的角度出发,我们可以提出更多的结构性问题,比如: 有多少客户仅仅购买了一个品类?多少客户购买了两个品类?多少客户购买了三个品类? 主要分布在哪些品类上? 仅仅购买了A品类、仅仅购买了B品类、仅仅购买了C品类,以及购买了所有这些品类的客户占比是多少? 购买某个品类的客户,同时购买其他哪些品类的概率更高?(连带购买分析) 比如先说第一个问题,哪些品类被反复购买,而哪些则被客户冷落?类似问题的背后,是查看每个客户购买的品类的次数,以及不同次数下的品类的分布。完整的说“(2019年)购买一个品类、两个品类、三个品类的客户数量分别是多少?” 这里的客户数量需要聚合,同时还需要客户层面的一个字段作为维度——每个客户的购买品类数。需要使用一个层次的(辅助计算)字段,又不能使用这个层次的维度字段本身,因此我们就需要使用LOD表达式提前计算这个结果:{fixed 客户名称: countd(类别) } . 这个问题,可以参考15大详细级别表达式的第一个题目。(【Tableau】15大详细级别表达式-会员分析案例(对话版)) 以这个字段作为维度,就可以查看购买了1个类别、2个类别……3个类别的客户数量(下图左上角)。不过这只是刚刚开始,我们还需要每一个条形图中更多的结构性组成,因此,我们把类别作为新的维度加入标记——颜色之中,发现了什么? 你会发现次数的坐标轴远远超过了此前的坐标轴对应的数量,为什么?因为这里购买2个以上的分类中客户出现了大量重复,以至于购买了三个类别的客户数量出现了三次——购买了A的客户数量,比如等于购买了B和C的客户数量,毕竟这些客户都是购买了三个类别。可以参考最开始的那个交叉图。 更专业的角度说,这是因为左边的图的详细级别停留在“客户购买的品类频次”,因此聚合为了三个数;而后者的详细级别进一步下沉,到了“客户购买频次” X “品类”,于是从三个标记,增加到7个标记。 结合上图下面的单品类情况图,我们发现,有23个客户仅购买过一个类别,其中仅购买办公用品的最多,占19人;有126人购买过两个类别,其中技术的连带率最低,仅有52人被连带购买了此分类;有622人购买了全部的三个类别。为了更清晰的看到分布,我们可以使用下面的这个图(借鉴了上面的图,但是比例和数值不对等,注意): 这样的绝对值虽然客观,但是不容易对比,我们还需要转化为百分比。从全部客户的角度看,上面的每个数值需要除以全部的客户数量,在没有筛选的情形下,我们使用总计百分比的结果,和除以{ countd(客户名称)} 的结果是一致的。 因此,增加“快速表计算”——“合计百分比”之后,默认就是上图中间左侧的图形。注意这里的百分比,购买2个类别和3个类别的各占比百分比合计会大于1,为什么,因为客户有重复。 因此,在这里仅购买过办公用品的19人占比2%,技术和家具分别占比不足1%;购买办公用品同时连带购买其他一个类别的客户123人占比16%,同时购买了三个品类的客户占比81%。——这些值都是和全部的客户总数比较。 这个可以使用中间的图形,也可以使用下面的图形来补充增强——在此前的数值基础上,增加更多的角度: 前面的数字代表交叉购买的类别数量,通过绝对值和百分比来突出具体的指标。这里只用了一个一次LOD计算和一次表计算,就可以完整展示不同交叉购买下的分类占比。很明显,这里的三个类别连带购买率占比很高,达到了81%;两个类别的连带购买率中,技术最低仅为7%Continue reading “【零售】Tableau LOD+TC做客户交叉购买分析(上)2.0更新”

【数据分析】用Tableau散点图,洞察数据意义

最近忙于其他事情,心里念念不忘我的Tableau,强迫今天坐下来写一篇新教程,工具是要常用常新的,否则,恐怕不过多少时日就武功尽废了。 上次我写直方图(【数据分析】用Tableau学习直方图📊),说明了Tableau与Excel、R的优势。今天,我想通过散点图、气泡图,说一下在实践中如何应用Tableau,从而洞察数据的意义,数据与业务的结合,是数据分析的真正基础。 一、作为运营的分析需求是什么? 在运营的实践中,常见的分析离不开商品、会员两大维度,大数据分析的基础一般直接来自于日常销售明细单,每一条数据都包含了商品、会员的一对一数据。作为运营经理,我会关心: 哪些商品的销售贡献和毛利贡献都高?或者说商品的销售和毛利贡献分布如何?从而区分商品的金牛、瘦狗、明星、问题角色。 哪些顾客的销售贡献最好?会员贡献的分布情况,从而找到核心顾客。 新增顾客的数量及贡献占比, 从监察的角度,从会员的贡献分布,寻找异常的大单顾客。 从门店店长的角度,我会关心: 哪些商品的交叉购物篮系数最高?找到适合做连带促销的商品; 哪些商品的动销率低于所在小分类平均水平? 重点商品的销售价格与销售数量的对应关系,防止过度营销损害长期盈利,又能保证促销的连贯性; 当然,上面的角度只是冰山一角,运营管理者还会关心诸如平均成交金额、顾客人均消费金额等数据,而且随着促销的节奏也会关心不同的数据及趋势。 不过,我上面列举的很多问题有一个共同点,就是涉及到至少两个数据。比如同时看销售金额和销售毛利,会员的销售金额与销售数量等。 如果要基于两个及以上的数据,寻找数据的规律,就需要在可视化层面平铺所有的数据,然后按照指定的数据轴聚合,这就需要用到散点图。在散点图中,我们可以看到数据的集群情况、极端数据的情况,如果结合对比图,就更加清晰。 散布图是大概了解趋势、集中度、极端数值的有效方式…… 什么情况下使用散布图:考察不同变量之间的关系。 ——Tableau官方 二、散点图,拯救数据小白 在Tableau中,最简单的散点图体现两个度量间的关系,两个“度量”分别放到行和列功能区,就可以形成一个包含数据点的散点图,不过默认只有一个散点。Tableau的可视化较Excel的高级之处,在“标记”功能处体现的淋漓尽致,把你想要的数据维度或度量拖到标记中,然后用颜色、大小、标签和形状的多种组合表现出来,就是变化莫测的数据图画。 比如说,我抽取了一段时间、某小分类的商品销售数据,然后要看一下不同品牌商品在销售金额和销售数量上的分布,未经修改,结果如下: 从上面可以看出来,“贝亲”两个指标都大幅领先,其次是“乐儿”和“新安”,其他品牌方比较集中,占比小且差异不大。 当然,这个散点图是比较粗糙的,我们可以通过调整坐标轴和增加“标记”极大地丰富这个散点图,比如: 过于紧密的坐标纵轴改为“对数”显示,减少数据重合; 使用计算字段计算“平均售价”,通过“标记”的颜色和标签加入到可视化层面。 如果有必要,增加趋势线。 如图: 在Tableau官方的的教程中,给出了散点图的使用建议,可以参考: 添加趋势线/最佳拟合线。添加趋势线可使数据间的相互关系更为明朗。 加入筛选条件。通过给散布图添加筛选条件,可快速向下搜索不同的图景与细节,从而发现数据中的模式。 使用信息丰富的标记类型。数据后的来龙去脉可使用相关形状进一步彰显。 三、散点图的变化,变化中发现洞见 基于上述的散点图,还可以有很多变种,这些无穷的变化,带我们发现数据背后的趋势。 1、矩阵散点图 散点图是表示数据变量的关系,在上面的基础上,还有很多高级的使用,比如把“维度”加入到“列”或者“行”功能区,就形成了矩阵散点图。 在上面的例子中,我们把“生理轴”加入到上面的散点图“列”功能区,就把原来的散点图按照生理轴划分为十个小矩阵。 从上面的图中可以看到各个生理轴的对比,比如该品类的销售集中在孕晚期到婴3月前,以及1岁到2岁;3岁以上出现了密集数据,推断很可能很多二胎使用了之前的会员卡。具体的分析,应该讲不同的产品在细分一个维度来看。 2、加入时间维度的“散点图”变种 标准的散点图是看度量之间的关系,有时候难免也要把时间考虑进来,比如看一个商品上市一年来的销售价格点分布,相当于分析时间和价格点的关系。 例如,某品牌从2016年11月上市之后的价格点如下, 从这个图上,我们可以看出,经过五个月的自然成长,该商品销售数量逐月大幅增长,同时销售价格保持稳定;2017年4月和5月,疑似持续的促销活动逐步开始降低成交价格,但销售数量并未明显增长;7月份,大幅的价格促销,降低了平均成交价格,销售数量并未增加,说明全场活动拉低了该商品本应该具有的盈利能力。 如果要加入辅助线帮助分析,不过需要把时间改为“离散”,否则不能按照“月”添加辅助线。如下: 当然,用散点图表达时间上的趋势有它的局限性,如有必要深入挖掘散点图中的线索,可以使用直方图来探寻。 3、气泡图 在Tableau中,气泡图属于单独的可视化样式,不过从散点图的角度理解,更有助于理解。 气泡图不是自成一类的可视化,而应视为强调散布图或地图上数据的手段。 我们使用气泡的原因是圆圈的不同大小揭示数据的意义。 散点图表达了多个度量之间的关系,从而发现趋势、集中程度等;气泡图相当于没有坐标轴的散点图,这样,可以避免坐标轴导致的数据重叠,强化了单个气泡本身的表达性。 比如说,我们把上面第一张图的销售金额和销售数量从“列”和“行”功能区删除,完全改为气泡,而在标记中,用颜色的深浅反映销售数量的多少,用气泡的大小代表销售金额的高低,标签显示品牌名称和平均价格,相比较而言,似乎比上面的散点图更加清晰。如图: Tableau官方说,什么情况下使用气泡: 显示数据沿两个轴的集中度。 在散点图上强调数据:通过改变数据点的大小和色彩,散点图和转化为丰富的可视化内容, 许多问题的答案一眼可见。 地图上的叠加层:气泡可便于看图人快速了解数据的相对集中度。把这些用作地图上的叠 加层,可以为看图人把地理相关数据快速有效地置于背景之中。Continue reading “【数据分析】用Tableau散点图,洞察数据意义”