在部署Tableau大数据分析系统的企业中,有相当一部分企业主要用于报表的呈现和部分业务分析,而少部分具有一定洞察力的分析师和业务经理会把Tableau用于业务的预测和假设分析;从这个角度看,Tableau能帮助大家看见未来。

任何声称自己是BI软件或者大数据分析软件的产品,两项高级分析功能必不可少,时序预测和假设预测。前者是基于预测算法预测后面一段时间的数据趋势,后者是基于特定的参数输入预测关键指标,比如调整毛利率加成查看对总的利润的影响。Tableau的优势在于,它极大地降低了业务用户和其他非技术用户使用高级分析的门槛,仅需拖拽和简单的参数、计算设定,即可把业务逻辑量化。

近期在给客户介绍过程中,进一步加深了对二者的理解,并结合案例介绍如下。

商业数据分析师,要把业务模式“经验语言”翻译为“数据语言”,实现经验的超越。

一、方案和假设分析预测

成功公司的经营是不断正确决策的累计,决策的过程就是不断的“提出多种假设——寻找可证实的假设——建立行动方案——在行动中提出新的假设——进一步验证假设”的循环往复的过程。在数据不标准、分析技术不先进的时代,我们依靠经验和有限的推理(计算器)来尽可能靠近真实,最关键的变量和武器——其实是时间。时间会改变一切,反复的耗时的计算,希望多发现一点点真理。

随着Excel的兴起,先见者每次都会使用复杂的函数验证假设,虽然提高了效率,但没有从根本解决问题:每次验证都像是重新开始,经验没有升华为分析和判断的数据模型。传统的工具让我们更加准确,但是也吃掉了更多的时间。

而敏捷BI软件希望改变这一切,一方面通过数据建模过程可以不断地积累分析的经验,形成反复可用的分析模型,另一方面借助“总体而非样本的数据分析”确保了有限数据内的无限准确。

1、从经验逻辑到数据逻辑:验证你的假设

业务的逻辑我们可以模拟为以下的图形,通过不断的提问和预测随之而来的变化,可以预测企业的收益和风险,从而指导决策。

在这里,最关键的步骤是“如何把业务模式的逻辑用数据逻辑来表达”,毫不夸张的说,如果能深刻地理解公司的业务逻辑并实现两种语言(经验语言和数据语言)的同步表达,你的所有问题已经解决了一半。洞察业务逻辑和趋势变化,企业就能洞察一段时间的行业未来。 

实现这一转化的巅峰代表,是桥水基金过去几十年来努力把宏观经济的运行框架转化为计算机程序,并赢得了世界级的伟大成就,它的思维方式和公司方案,推荐瑞·达里欧的《原则》和《债务危机》两本书。我希望以后能用这样的思维逻辑来实现公司级别的成就。

屏幕快照 2019-06-02 上午8.39.31.png

2、“Tableau”你的假设

作为面向业务人员的敏捷BI代表,Tableau可以轻松实现“从参数输入到预测结果输出”的假设分析,即分析某个或某几个输入结果的变化对结果的影响。这里需要用到Tableau的几个基本功能:

  • 参数:参数作为交互的入口,接收访问者的数据调整,传递给数据模型;
  • 计算字段:多个计算字段的组合,把业务逻辑数据化,接收参数并不断计算,
  • 交互动作:通过筛选器、高亮、集值、参数动作等交互方式,进一步增强与数据模型的交互,更好地控制分析的范围、输入的参数值。

屏幕快照 2019-06-02 上午9.05.07.png

3、基于采购和毛利加成的简单模型

近期在和一家客户沟通Tableau的方案分析时,大家模拟了一个最简单的模型:在已知目前的货物库存预期销售数量前提下,需要通过预测一定数量的采购量(或者加工量),来平衡预期的销售订单,并根据毛利加成计算因为富余采购带来的毛利额。

假设预测 bcfoods

暂时抛开时间的要素,我们可以设定采购数量、采购单价、毛利率加成为参数,然后通过多个计算字段模拟业务模式(“按计划销售后的库存富余”、“富余库存预计毛利额”),最后以数字或者可视化的方式来展示假设方案的结果。

在Tableau自带的超市仪表板中,我们也可以类似的案例,在“销售预测”中我们可以通过输入增长率和流失率来直观的查看未来一段时间的业绩状况,从而作出更好的决策。

二、时序分析和预测分析

在所有的数据环境中,时间是最重要的字段之一;连续的时间分析可以寻找波动性和规律性的特征,也可以通过聚合时间(比如以季度为聚合维度)对比相互之间的显著差异。因此,在《可视化最佳实践:如何选择可视化图形?》中,我们把基于时间的分析分为“连续时间的折线图趋势分析”和“离散时间的柱状图对比分析”两大类。

我们大部分的数据都以时间序列的方式存在,比如设备的运行数据、门店的销售数据、股票的每日变化等,我们可以通过拖拽时间字段和度量字段,直观地查看基于时间的波动曲线。而在Tableau中,仅需将分析区域的“预测”拖拽到工作区,即可立即生成预测分析。

1、生成基于时间的预测

假设我们要生成“公司开业至今各月的销售波动”这样的折线,我们需要使用“时间(月)”和“销售”这两个字段,前者是分类字段,后者是度量字段。在Tableau中,我们要养成一个习惯是,如果要生成可视化,先双击度量。

时间序列 .jpg

从上面的波动看,我们能发现大致的周期性,每年年底都是业绩低谷,而10月左右是业绩高峰,也就是说,销售具有一定的季节周期特征。如果根据过去多年的业绩预测未来的业绩状况?仅限从左侧“分析”工具栏,把“预测”拖拽到视图即可。

时间序列 预测.jpg

在这里,Tableau会自动忽略最后一个月的数据(往往最后一个月数据不完整),同时自动选择预测的模型(比如是否把季节作为一个预测变量),在大部分情况下,我们建议相信Tableau的选择。在此基础上,可以可以通过添加“趋势线”,更好的辅助理解变化的趋势。

2、基于时序的相关性分析

在“如何选择可视化”的分享中,我们区分了成分、项目、时间序列、频率分布、相关性六大主题。两个度量的相关性往往使用散点图来表示,但是在业务分析中,有很多的相关分析是与时间有关的,可以理解为“时间序列+相关性分析”的结合。比如“不同时间段,出租车的小费是否与行程里程有关?” 这里有时间、里程、小费三个字段,时间是维度,里程和小费是度量,三折都是连续的,因此全部生成坐标轴,通过“双轴”可以把三个轴放在一起,如下:

基于时间的度量相关性.jpg

我们可以清晰地发现,每公里小费随着行驶距离有一定的相关性,对吗?

仔细看,这里的里程是每个时间段的总里程(绝对值),而小费则是每公里的小费(比率),上图反应的是绝对值和比率的相关性!这是具有误导性的,准确的说,我们应该对比“单位里程”和“单位小费”的相关性,因此我们也需要把上面的里程距离改为“单位距离”,比如时间段的里程除以总的里程时间,见下图第二个双轴图:

出租车 分析 里程与小费.jpg

可见,单位里程的小费和单位时间的行程基本没有想关系,甚至体现出负相关特征;当然我们可以从更大的时间范围进一步验证。

上面的错误分析想要传递的价值信息是:对于时间分析而言,最关键的是如何提出有效的问题,以及如何把问题有效地转化为逻辑性的数据表达。

更多关于预测、趋势线、参考线等方面的问题,敬请参考Tableau使用说明。

 

三、面向中型企业的数据分析黄金建议

很多中型企业的业务模式相对简单,更容易实现类似的业务模型的数据化,但是这些企业也面临很多因为历史原因导致的天然障碍,比如数据不完整不统一、业务模式变化频繁;即便如此,在数据模型方面的任何一次努力,都是有助于企业精益增长的努力。唯有数据不会骗人。

1、把数据和分析分开

最重要的建议,是把数据和分析分开。我最近在沟通的一家巨型垃圾发电企业,每个设备的检测数据和统计分析数据都在同一个Excel中,并且分月保存和分析,导致做同比环比时异常苦难,而且经常遇到名称不一致的情况。

对于这样的其而言,不管你的数据是否符合关系数据库的范式要求,只要能把数据和分析分开,就是最革命性的一步。对于要坚持使用Excel的人,至少也要把数据和分析分开,这一点推荐大家学习《你早该这么玩Excel》,学习和借鉴“参数表、元数据表、透视表”三表方法,绝对受益无穷。

2、尝试把业务逻辑和业务问题数据化

对于商业分析师而言,我想最重要的事情是“翻译”——把理解业务模式使用的经验语言,翻译为用数据说话的数据语言。即便是努力弥补二者之间的差距,所能带来的商业价值也会让企业受益无穷。

比如说,一家企业每个月都在分析哪些问题?这些问题背后的业务逻辑是什么?假设是会员逻辑,如何把关注的会员逻辑中最重要的三个问题用数据表达出来?成功的商业“翻译家”会把问题转化为每月定时使用的可视化报表,一劳永逸地解决问题,然后用更多的时间去完善和精深数据模型。

不妨,从问几个问题开始:

  • 我们每个月都在问的三个问题是什么?
  • 我们每个月最担心的事情是什么?
  • 有哪些是不容易察觉但是可能会突发爆发的隐形问题?

3、让提问题的人找答案

过去,依赖于业务分工和IT的天然壁垒,大部分企业都把数据分析作为“专业的工作”委托出去;如今,到了收回本该属于业务人员的工作的时候了。之前我从牛人那里了一个重要的企业管理法则,叫做“谁痛苦,谁推进”,深有益处,如今,我想再加上一条,分享给大家。

  • 企业难题:谁难受,谁推进;
  • 数据分析:谁提问题,谁分析。

 

关于Tableau产品、使用、服务、培训方面的问题,敬请联系:

喜乐君 | Tableau Partner

Jun 2, 2019 by