在服务客户的过程中,我们深感当前大家对于整个数据文化与数据工具了解的匮乏和需求的迫切,并深度地参与了部分客户的分析项目。在此,我们希望总结相关的经验和方法论,帮助更多的人更好地利用Tableau实现大数据敏捷分析,并指向“业绩高效改进”和“客户持续满意”这两个终极目标。

为了阐述的方便和面向不同的客户需求,我们会区分“小循环:Tableau从数据到业务洞见”和“大循环:Tableau从数据到自主化分析”两个主题。前者主要面向于身兼数值的业务分析者,往往一人完成从需求分析到数据发现的全过程,而后者主要面向于分工更加明确的企业集团,多个岗位甚至多部门合作,为整个公司提供自助式业务分析的平台工具。

一、现代业务分析面临的新环境

毫无疑问,如今的世界是数据大爆炸的时代,也是数据驱动的时代。每个人和每个企业都面临了崭新的数据环境。一方面,出现了越来越多的非结构化数据,它们如此重要却又如此难以洞察,单一的数据源已经不能满足我们分析的需求,单一的数据环境已经无法容纳越来越庞大的数据存放;另一方面,过多的数据伴随巨大的数据噪音,传统以Excel和SQL为代表已经难以帮我们清理数据并寻找洞见,越来越多的业务经理、分析助力被困扰在数据之中。

更重要的是,变化太快了,数据分析的架构和结果,也要随时准备接纳新的业务需求和数据源加入,这就要求极高的敏捷性和扩展性。

从Excel分析到传统BI分析,再到敏捷BI和自助式BI分析。

不管是面向个人分析的小循环,还是面向企业分工的大循环,我们都面临几个共同的难题:确定需求后的数据清理,并以人人易懂的可视化方式展现。

屏幕快照 2018-08-24 下午3.03.27

为此,我们可以把整个分析过程分为三个阶段:

  • 业务需求分析:知道我们要做什么和去哪里,会提高整个环节的效率,同时,我们还要清晰地区分临时需求与持续需求的不同。
  • 数据组织和清理:根据需求的指引,汇集多个数据源,清理、组织并搭建合适的数据详细级别,从而为高效、稳健的可视化输出奠定基础;
  • 需求可视化与业务洞察:以最佳的可视化效果体现需求中的数据重点,提供必要的数据分析指引,帮助业务人员把数据转化为行动和业务价值。

二、业务需求分析

需求是所以行动的准则,可惜的是,在商业环境中几乎必然存在着业务人员和IT人员的对立。业务人员“告诉”IT人员自己想要什么,IT看上去“听懂了”对方的需求,结果就是在分析中不断地重新探讨需求,以至于最后泯灭了目的。对此,我是深有体会。

数据分析

因此,敏捷BI的一个口号就是“让提问题的人自己寻找答案”,工具如此简单,数据就在眼前,而IT人员从数据保护者变身为分析指导者,如此而来,世界瞬间美好。

当然,大多数企业还不具备如此协作的能力,“业务人员不懂技术,技术人员不懂业务”,同时又不愿意换时间进入对方的地盘,注定前途漫漫。在这种情况下,探索式分析就成了一个糅合二者的选择。IT人员和分析师在充分了解业务人员需求的基础上,为对方提供经过整理的数据源甚至自助式分析的平台,帮助业务人员充分的探索数据,在灵活性和专业性中间获得某种模糊的平衡。

在这个过程中,IT人员和数据分析师需要把业务人员的需求转化为数据源和可视化图表,甚至要加入自己对于业务的理解。

 

三、Tableau创建高效、可持续的数据源

从小循环的角度,我们把“数据分析驱动业务成长”分为需求分析、数据清理和数据分析三个阶段。需求分析指明数据分析的目的和方向,数据清理准备高可用性的分析材料,而数据分析则从数据中挖掘业务洞见形成业务操作。数据清理是前后的衔接,是准确性的关键要素。

1、构建高效的数据源

使用过传统的BI工具或者Excel来做分析的人都能感受到,准备可用的数据往往是最耗费精力和时间的事情,尤其是遇到多个数据源、Excel不规范、部分数据不完整的时候;在此情况下,一方面数据分析者往往需要专业IT人员或者专业工具的协助,另一方面在数据准备上过多的时间和低效率影响了数据分析的输出质量。这是数据分析师遇到的第一大问题。

屏幕快照 2018-08-24 下午3.03.43

按照理想的方式,我们希望用更多的时间做数据分析,而不是数据清理,同时,面对频繁的数据分析任务,我们希望构建高效率的数据源,它应该具备以下基本的特征:

  • 能重复使用。我们希望数据源的构建过程能独立于数据分析过程,同时又能浑然一体,这样可以在多个情形下反复使用数据源,而无需每次都从头再来。
  • 可持续改进。在重复使用的基础上,高效的数据源能接受不断地修复与完善,根据数据和业务的需求持续改进,它应该是一个独立的模型,而不仅仅是分析的一部分。
  • 相互独立,避免干扰。为了实现重复使用和持续改进,我们希望数据清理过程能单独存在于分析,最好能与数据库管理人员高效结合,确保整个数据源的清理规则,能在某个范围内得到统一的贯彻。

2、使用Tableau Prep制作数据源

幸运的是,Tableau推出了独立的数据清理工具Prep,使用Prep,你可以快速地合并、组织和清理你地数据,它和Desktop、Server地结合,让整个数据分析过程浑然天成。

Prep可以实现多个数据源的数据混合,完整的记录每一步数据清理步骤,主要有以下特征:

  • 全面洞悉数据:提供三个协调一致的视图,供您用来查看行级数据、各列概况和整个数据准备流程。
  • 立即获得结果:如果想编辑某个值,只需将其选中即可直接编辑,所见即所得。数据连接、并集等复杂操作都会即时呈现。

  • 多种智能工具:提供分组、拆分、删除异常字符等一键操作。

对于复杂的数据源操作,我已经把Prep作为一种必备的工具,下图是商品及订单整理的部分示例,加载本地的多个数据文件,通过各个“步骤”(step)记录了每一步操作保证随时修改,使用“聚合”(aggregate)重新整理数据获得我想要的详细级别,从而加速事后分析的过程(这一点会越来越重要),通过两个数据流的“关联”(Joint)可以实现数据混合,甚至作为数据清理的方法(本例中订单数据帮助排除了商品中的非支付商品信息),最后统一“输出”(output)为hyper高速引擎文件,发布到server或者本地传输给Desktop开始分析。一气呵成,浑然一体。

prep 示例 .jpg

本文的重点并非是数据整理,更多介绍和使用,参考Prep系列文章。

3、必要时,与Server结合

对于针对个人分析的小循环而言,最快的方式是把prep生成的hyper文件导入到Tableau Desktop即可马上开始分析。Prep和Desktop的结合,就是完成任务的完美方式;不过如果需要团队合作,那么Server就是组织中最好的桥梁,我们将在下一篇“大循环:从数据到自助式业务”重点介绍。

Picture1.png

关于server的更多内容,欢迎参考Server系列文章。

四、数据分析与业务洞察

在拥有了经过整理的数据之后,接下来就是最具有挑战性的阶段:把数据转化为价值。我们可以从三个方面阐述如何高效地完成这个过程。

1、如何选择可视化图形

众所周知,我们每个人对图形的敏感性天然地高于文字和数字,但是只有合适的图形才不会引起理解上的歧义,才能更好地帮助我们理解数字,而不是增加理解的复杂性。因此,合适、简单的图形才是最好,切忌追求图形的复杂和外表的绚丽。

如何选择可视化的图形方面,我们推荐麦肯锡的分析方法,总结起来可用一张图片来概括:

Screen Shot 2019-02-11 at 10.24.24 AM.png

在合适的场合下,选择合适的图表,这就是数据可视化的第一原则。推荐大家阅读《用图表说话》这本小书,内容不多,方法却非常好。

2、高效使用工作簿、仪表盘、故事

Tableau内置了多种可视化容器,工作簿workbook是最小的单元,工作簿组成仪表板Dashboard,而工作簿、仪表板可以组成故事story。

我们可以把分析假定为一个个最小的主题,比如价格矩阵分析、价格带分析、品类生命周期分析等等,在完成每一个工作簿粉丝后,再把相关的工作簿按照需求和分析需要整合为仪表盘,比如奶粉品类产品价格与波动分析仪表盘、奶粉品牌生命周期与价格矩阵仪表盘等等。而当我们要讲述一个故事时,往往要增加故事的背景和不同的层次,比如需要多短期、中期、长期看价格波动,就可以通过筛选器分为三个不同的页面,引导听故事的人循序渐进。

在设计时,Tableau推荐您考虑以下几个重要内容:

  • 选择有意义的指标。不要被单一指标蒙蔽,多使用比率指标和业务指标。
  • 通过集成多个数据源来获得全面的信息
  • 只有当主题足够长时,才考虑使用故事,展开一个分析线条

关于讲述故事,官方推荐了多个讲述故事的方法,我们会改日单独讲述。在此可以参考官方白皮书入门:

3、使用互动选项

Tableau的简单在于功能的易用和便捷,每一个分析者都可以快速熟练使用筛选器、分级结构等开始互动的分析和练习,必要时再增加参数、TOP和跳转等互动选项,进一步增加互动的灵活性和范围。

在2018.3.3的版本中,Tableau Desktop增加了“button”功能,更加方便了故事的讲述互动。

 

大数据分析的兴起,是数据时代和商业进步共同推动的结果,无数据不决策,数据驱动业务成长,是商业世界的必然之路。而在这条路上,遇到的最大困难,想必就是业务人员与技术IT人员的割裂,“懂技术的人不懂业务,懂业务的人不懂技术”。

敏捷BI凭借通过自助式分析和探索式分析技术,为这个矛盾带来了缓解之道。希望更多的人能沿着“需求-数据-分析”的道路,让数据为我所用,让业务高效前行。

 

更多相关内容,可以参考

Feb 11, 2019 Happy New Year
Feb 12, 2019 Update
喜乐君 · Michael Wu