昨天看了《大数据》(涂子沛 著)中一个章节“商务智能的前世今生”,对BI有了更加深入的印象,简而言之,可以用下面的一张图来表示。这其中“关系型数据库”和“数据仓库”是基础,商务智能的重要工具和展现应该是联机分析+数据挖掘+可视化设计的结合。

P70904-172103(1)

Tableau的底线是基于关系数据库自己搭建的数据立方(Cube),然后通过独有的数据引擎做抽取和整理,最终实现可视化的表达。

在之前的博文中我们说,“清晰的业务分析思路应该先于数据分析的技术”,我们应该按照先确立数据分析的目的,然后开展数据工作。

数据分析的方向和目的

周年庆的分析是阶段性的业务分析,整体的维度指标围绕业务的几个重要主题:商品、会员和员工;在对比的层面,我们要对比去年的相关指标,特别是体现增长性和健康度的指标,如品类的毛利率水平、会员的结构分布与贡献度、员工的投入产出效率等。

具体而言,我们可以建立以下的分析框架:

  • 宏观指标:两个对比期的商品销售、毛利额/毛利率、消费会员数及平均贡献、员工的贡献对比。
  • 会员维度

    • 生理轴分布下的消费会员数量(及占比)、会员消费贡献、
    • 会员贡献分布与极值分析,可以分门店卡和非门店卡。
    • 与2016年的比率对比
  • 商品维度:

    • 品类层面:品类的贡献,品类销售数量与单价,品类客单价
    • 门店层面:可比门店的商品运营指标,看增长率,会员会员
    • ABC商品分布,或者20/80分布,看销售贡献与毛利贡献
  • 员工维度:

    • 促销员的人效产出,可以按照厂家促销员、星级分类
    • 与去年同期对比

 

下面,我们以「会员分析」之「散点图分布」为例:

1、ETL 抽取、整理和加载

这几阶段,Tableau相关的几个功能是:导入数据源、整理数据字段、数据抽取与优化,还可以包含字段的“别名”、“分组”等。

比如对于要排序的字段,可以通过别名实现自定义排序;还可以使用通用的名词。

sUMDPkQe45.gif   屏幕快照 2017-09-05 上午8.43.04.png

另外,个人不建议把数据库中的英文标题一律改为中文,因为这样会阻碍之后增加和编辑字段的难度。当然,一些难以理解的英文字段,也可以增加汉语后缀。

2、增加计算字段

在消费明细中,有一些字段是没有的,需要通过「计算字段」自行添加,从而更好地辅助数据分析;同时,这也是阶段性代替数据仓库,增加数据分析的维度。

因为数据是商品的消费明细单,从会员的角度计算人均消费金额和人均消费数量,就需要使用全局fixed函数,当我们把两年的数据合并在一起,还需要把两年的数据分开,从而做对比。因此,我们增加了两个计算字段:

会员消费金额:{ FIXED YEAR([XSSJ]),[CardCode]:round(SUM([xsje]),1)}
会员消费数量 :{ FIXED YEAR([XSSJ]),[CardCode]: SUM([xssl])}

屏幕快照 2017-09-05 下午4.58.28

屏幕快照 2017-09-05 下午4.58.00

3 制作散点图

有了会员的两个核心字段,我们就可以做会员的分布了,把「人均消费金额」和「人均消费数量」分别放到 列 和 行 字段中,并把度量改为维度,于是就形成了一个空间;之后把会员数据放到空间里,形成了分布图。

然后就是增加筛选原则,比如排除「店内卡」,按照年份作为页面。于是,就有了会员散点图。

oa336mkERH

其他的可视化与上述类似,提前设定字段,简单的字段可以直接在列/行中输入,比如输入 SUM([xsje])/COUNTD([New_DH])  直接计算平均订单金额。

 

 

结语

学习Tableau两个月了,期间也教公司的一些同事,有的人会仿照表格的方式去做,这是一个误区,最好的方式是,定好目标,然后准备元素,之后拖动可视化。

 

20170905