昨天看了《大数据》(涂子沛 著)中一个章节“商务智能的前世今生”,对BI有了更加深入的印象,简而言之,可以用下面的一张图来表示。这其中“关系型数据库”和“数据仓库”是基础,商务智能的重要工具和展现应该是联机分析+数据挖掘+可视化设计的结合。
Tableau的底线是基于关系数据库自己搭建的数据立方(Cube),然后通过独有的数据引擎做抽取和整理,最终实现可视化的表达。
在之前的博文中我们说,“清晰的业务分析思路应该先于数据分析的技术”,我们应该按照先确立数据分析的目的,然后开展数据工作。
数据分析的方向和目的
周年庆的分析是阶段性的业务分析,整体的维度指标围绕业务的几个重要主题:商品、会员和员工;在对比的层面,我们要对比去年的相关指标,特别是体现增长性和健康度的指标,如品类的毛利率水平、会员的结构分布与贡献度、员工的投入产出效率等。
具体而言,我们可以建立以下的分析框架:
- 宏观指标:两个对比期的商品销售、毛利额/毛利率、消费会员数及平均贡献、员工的贡献对比。
-
会员维度
- 生理轴分布下的消费会员数量(及占比)、会员消费贡献、
- 会员贡献分布与极值分析,可以分门店卡和非门店卡。
- 与2016年的比率对比
-
商品维度:
- 品类层面:品类的贡献,品类销售数量与单价,品类客单价
- 门店层面:可比门店的商品运营指标,看增长率,会员会员
- ABC商品分布,或者20/80分布,看销售贡献与毛利贡献
-
员工维度:
- 促销员的人效产出,可以按照厂家促销员、星级分类
- 与去年同期对比
下面,我们以「会员分析」之「散点图分布」为例:
1、ETL 抽取、整理和加载
这几阶段,Tableau相关的几个功能是:导入数据源、整理数据字段、数据抽取与优化,还可以包含字段的“别名”、“分组”等。
比如对于要排序的字段,可以通过别名实现自定义排序;还可以使用通用的名词。
另外,个人不建议把数据库中的英文标题一律改为中文,因为这样会阻碍之后增加和编辑字段的难度。当然,一些难以理解的英文字段,也可以增加汉语后缀。
2、增加计算字段
在消费明细中,有一些字段是没有的,需要通过「计算字段」自行添加,从而更好地辅助数据分析;同时,这也是阶段性代替数据仓库,增加数据分析的维度。
因为数据是商品的消费明细单,从会员的角度计算人均消费金额和人均消费数量,就需要使用全局fixed函数,当我们把两年的数据合并在一起,还需要把两年的数据分开,从而做对比。因此,我们增加了两个计算字段:
会员消费金额:{ FIXED YEAR([XSSJ]),[CardCode]:round(SUM([xsje]),1)}
会员消费数量 :{ FIXED YEAR([XSSJ]),[CardCode]: SUM([xssl])}
3 制作散点图
有了会员的两个核心字段,我们就可以做会员的分布了,把「人均消费金额」和「人均消费数量」分别放到 列 和 行 字段中,并把度量改为维度,于是就形成了一个空间;之后把会员数据放到空间里,形成了分布图。
然后就是增加筛选原则,比如排除「店内卡」,按照年份作为页面。于是,就有了会员散点图。
其他的可视化与上述类似,提前设定字段,简单的字段可以直接在列/行中输入,比如输入 SUM([xsje])/COUNTD([New_DH]) 直接计算平均订单金额。
结语
学习Tableau两个月了,期间也教公司的一些同事,有的人会仿照表格的方式去做,这是一个误区,最好的方式是,定好目标,然后准备元素,之后拖动可视化。
20170905
《【数据】用Tableau 制作会员散点图》有2个想法