最近忙于其他事情,心里念念不忘我的Tableau,强迫今天坐下来写一篇新教程,工具是要常用常新的,否则,恐怕不过多少时日就武功尽废了。

上次我写直方图(【数据分析】用Tableau学习直方图📊),说明了Tableau与Excel、R的优势。今天,我想通过散点图、气泡图,说一下在实践中如何应用Tableau,从而洞察数据的意义,数据与业务的结合,是数据分析的真正基础。

一、作为运营的分析需求是什么?

在运营的实践中,常见的分析离不开商品、会员两大维度,大数据分析的基础一般直接来自于日常销售明细单,每一条数据都包含了商品、会员的一对一数据。作为运营经理,我会关心:

  • 哪些商品的销售贡献和毛利贡献都高?或者说商品的销售和毛利贡献分布如何?从而区分商品的金牛、瘦狗、明星、问题角色。
  • 哪些顾客的销售贡献最好?会员贡献的分布情况,从而找到核心顾客。
  • 新增顾客的数量及贡献占比,
  • 从监察的角度,从会员的贡献分布,寻找异常的大单顾客。

从门店店长的角度,我会关心:

  • 哪些商品的交叉购物篮系数最高?找到适合做连带促销的商品;
  • 哪些商品的动销率低于所在小分类平均水平?
  • 重点商品的销售价格与销售数量的对应关系,防止过度营销损害长期盈利,又能保证促销的连贯性;

当然,上面的角度只是冰山一角,运营管理者还会关心诸如平均成交金额、顾客人均消费金额等数据,而且随着促销的节奏也会关心不同的数据及趋势。

不过,我上面列举的很多问题有一个共同点,就是涉及到至少两个数据。比如同时看销售金额和销售毛利,会员的销售金额与销售数量等。

如果要基于两个及以上的数据,寻找数据的规律,就需要在可视化层面平铺所有的数据,然后按照指定的数据轴聚合,这就需要用到散点图。在散点图中,我们可以看到数据的集群情况、极端数据的情况,如果结合对比图,就更加清晰。

散布图是大概了解趋势、集中度、极端数值的有效方式……
什么情况下使用散布图:考察不同变量之间的关系。

——Tableau官方

二、散点图,拯救数据小白

在Tableau中,最简单的散点图体现两个度量间的关系,两个“度量”分别放到行和列功能区,就可以形成一个包含数据点的散点图,不过默认只有一个散点。Tableau的可视化较Excel的高级之处,在“标记”功能处体现的淋漓尽致,把你想要的数据维度或度量拖到标记中,然后用颜色、大小、标签和形状的多种组合表现出来,就是变化莫测的数据图画。

比如说,我抽取了一段时间、某小分类的商品销售数据,然后要看一下不同品牌商品在销售金额和销售数量上的分布,未经修改,结果如下:

品牌分布
某分类的品牌分布(销售金额*销售数量)

从上面可以看出来,“贝亲”两个指标都大幅领先,其次是“乐儿”和“新安”,其他品牌方比较集中,占比小且差异不大。

当然,这个散点图是比较粗糙的,我们可以通过调整坐标轴和增加“标记”极大地丰富这个散点图,比如:

  • 过于紧密的坐标纵轴改为“对数”显示,减少数据重合;
  • 使用计算字段计算“平均售价”,通过“标记”的颜色和标签加入到可视化层面。
  • 如果有必要,增加趋势线。

如图:

屏幕快照 2017-10-16 下午6.33.12.png
通过“标记”增加可视化内容

在Tableau官方的的教程中,给出了散点图的使用建议,可以参考:

  • 添加趋势线/最佳拟合线。添加趋势线可使数据间的相互关系更为明朗。
  • 加入筛选条件。通过给散布图添加筛选条件,可快速向下搜索不同的图景与细节,从而发现数据中的模式。
  • 使用信息丰富的标记类型。数据后的来龙去脉可使用相关形状进一步彰显。

三、散点图的变化,变化中发现洞见

基于上述的散点图,还可以有很多变种,这些无穷的变化,带我们发现数据背后的趋势。

1、矩阵散点图

散点图是表示数据变量的关系,在上面的基础上,还有很多高级的使用,比如把“维度”加入到“列”或者“行”功能区,就形成了矩阵散点图。

在上面的例子中,我们把“生理轴”加入到上面的散点图“列”功能区,就把原来的散点图按照生理轴划分为十个小矩阵。

屏幕快照 2017-10-16 下午6.40.02.png
加入“维度”形成矩阵散点图(纵轴使用对数)
屏幕快照 2017-10-16 下午6.44.40.png
加入“维度”形成矩阵散点图(纵轴 无 对数)

从上面的图中可以看到各个生理轴的对比,比如该品类的销售集中在孕晚期到婴3月前,以及1岁到2岁;3岁以上出现了密集数据,推断很可能很多二胎使用了之前的会员卡。具体的分析,应该讲不同的产品在细分一个维度来看。

2、加入时间维度的“散点图”变种

标准的散点图是看度量之间的关系,有时候难免也要把时间考虑进来,比如看一个商品上市一年来的销售价格点分布,相当于分析时间和价格点的关系。

例如,某品牌从2016年11月上市之后的价格点如下,

屏幕快照 2017-10-16 下午7.18.45.png
某品牌单品上市后逐月成交价格点

从这个图上,我们可以看出,经过五个月的自然成长,该商品销售数量逐月大幅增长,同时销售价格保持稳定;2017年4月和5月,疑似持续的促销活动逐步开始降低成交价格,但销售数量并未明显增长;7月份,大幅的价格促销,降低了平均成交价格,销售数量并未增加,说明全场活动拉低了该商品本应该具有的盈利能力。

如果要加入辅助线帮助分析,不过需要把时间改为“离散”,否则不能按照“月”添加辅助线。如下:

屏幕快照 2017-10-16 下午7.31.28.png
添加四分位线辅助分析(时间需要为离散)

当然,用散点图表达时间上的趋势有它的局限性,如有必要深入挖掘散点图中的线索,可以使用直方图来探寻。

3、气泡图

在Tableau中,气泡图属于单独的可视化样式,不过从散点图的角度理解,更有助于理解。

气泡图不是自成一类的可视化,而应视为强调散布图或地图上数据的手段。
我们使用气泡的原因是圆圈的不同大小揭示数据的意义。

散点图表达了多个度量之间的关系,从而发现趋势、集中程度等;气泡图相当于没有坐标轴的散点图,这样,可以避免坐标轴导致的数据重叠,强化了单个气泡本身的表达性。

比如说,我们把上面第一张图的销售金额和销售数量从“列”和“行”功能区删除,完全改为气泡,而在标记中,用颜色的深浅反映销售数量的多少,用气泡的大小代表销售金额的高低,标签显示品牌名称和平均价格,相比较而言,似乎比上面的散点图更加清晰。如图:

屏幕快照 2017-10-16 下午7.42.28
某小分类品牌气泡图

Tableau官方说,什么情况下使用气泡:

  • 显示数据沿两个轴的集中度
  • 在散点图上强调数据:通过改变数据点的大小和色彩,散点图和转化为丰富的可视化内容, 许多问题的答案一眼可见。
  • 地图上的叠加层:气泡可便于看图人快速了解数据的相对集中度。把这些用作地图上的叠 加层,可以为看图人把地理相关数据快速有效地置于背景之中。

四、大爱Tableau的表现力

看到这里,你是不是也喜欢上了Tableau 的卓越表现力,相较于Excel,Tableau就像是一个艺术家。它多才多艺而不失内涵,所有的展现,都来自于它丰富的内心。

 

链接:

我的Tableau学习笔记

16 Oct 2017