2016年,我在一家母婴零售公司努力调整职业方向,从后勤行政和服务部门向业务部门转型,捷径是通过数据分析了解业务逻辑。不满足于Excel,我开始寻找和对比各种大数据可视化分析软件,直到遇见Tableau,凭着对数据的敏感,认为这是大势所趋,于是开始从尝试到执著。

接下来的三年多时间,Tableau陪伴我实现了职业的转身,它帮助建立全局的视野,以数据指导业务行动;后来在多个公司推广Tableau,服务了更多的人。如今,走在创业的路上,Tableau是我最好的战友。

一、何为Tableau

网上有人称之为“大数据时代的梵高”,虽有盛誉之嫌,真正爱上Tableau的软件,也算实至名归。它的可视化效果,在BI领域算得上独树一帜,引领同行。

诞生于2003年的Tableau,基于斯坦福独有的专利数据技术 VizQL,这个专利技术创新性地把拖动等操作转化为查询语言,然后通过图形化表达出来,就是我们看到的无与伦比、夺人眼球的可视化了。

Tableau——帮助用户理解自己的数据。

它的口号也会让你动心——“所有人都能学会的业务分析工具”。Tableau不是面向技术人员设计的,而是面向业务人员设计的;业务人员了解自己的需求和企业的数据真相,往往畏惧于技术的艰涩和抽象,技术和业务的天然屏障一直依赖阻碍着“业务技术”的成长。Tableau的入门和使用对于业务人员足够简单,并不比Excel更难;同时它的平台化和高级分析技术又足够高级,可以用学习换取更大的功能。因此,它就成为了业务人员修炼自己的大数据可视化的极好选择。

Gartner说:“2020年,平民数据科学家的数量其增长速度将比数据科学家的数量快五倍。”

如今,随着Prep的推出和不断升级,Tableau把最耗时的数据整理和清理部分也变得可视化了,进一步降低了业务人员学习的成本,为越来越多的“平民数据科学家”的成长铺平了道路。

 

二、“平民数据科学家”修炼三阶段

每个阶段学习一本新技能,都是充满了风险的。王国维说治学有三重境界,现在回首,体会到了这种感觉。“‘昨夜西风凋碧树。独上高楼,望尽天涯路’。此第一境也。‘衣带渐宽终不悔,为伊消得人憔悴。’此第二境也。‘众里寻他千百度,蓦然回首,那人却在,灯火阑珊处’。此第三境也。”

第一阶段 独上高楼

学习始于探索,刚开始使用Tableau的人都会兴奋于它的方便快捷,也会慢慢发现后面还有很多需要不断学习。在好奇中前进,在学习中磨练。从连接本地数据开始练习,而后了解Tableau的基本概念(字段分类、属性、聚合、操作顺序),再掌握最常用的软件工具:分层结构实现钻取、组和集实现自定义分类、参数实现自定义交互、计算字段通往无尽的扩展。这几个部分稍加练习,就可以作出最基本的可视化效果。

  • 数据连接和基本整理
  • 了解Tableau的基本概念
  • 常用的数据整理方法
  • 常见的数据可视化样式
  • 生成基本的数据可视化

Screen Shot 2019-04-24 at 7.08.33 AM.png

第二阶段——学习 LOD和高级分析,为伊消得人憔悴

Tableau的学习门槛足够低,十岁的孩子都能使用,这吸引越来越多的人超越Excel进入大数据可视化的领域,同时,Tableau又有足够多的高级功能,能满足各行各业对高级分析、高级统计的需求。在学习的第二个阶段,缓慢而艰难,主要包括几个部分:

  • LOD详细级别表达式;
  • 高级表计算,以及如何选择计算解决问题;
  • 高级可视化,如帕累托图形、盒须图等。
  • 如何选择多种计算?

Screen Shot 2019-04-16 at 5.06.59 PM

随着业务分析的深入,LOD表达式和表计算会成为随处需要的通用技能,因此,我们会在本书中着重结合案例介绍“如何选择计算”以及“使用各种计算背后的思维方法”,期望帮助更多的人达到举一反三。

 

第三阶段——教学相长,终生学习

我一直相信教学相长,因此在学习的过程中通过博客分享自己的心得,并积极推动企业大数据部门采用Tableau进行可视化分析。不要吝啬分享,就会获得更多。我刚开始每个月做免费的Tableau分享,还赠送自己的博客文集,朋友说我赔钱太多,在我看来都是对这条道路的探索,过早的商业化会扼杀了未来的路。

mmexport1554786204174782375163253962310.jpg

同时,需要不断的学习新技术,了解Tableau从prep、desktop到server的整个架构,还需要学习数据挖掘的高级方法如python。我集中花时间考完了Tableau的desktop 和ServerQA,凭借长期的锻炼,才开始敢到企业中磨练自己,推广Tableau。

三、学习Tableau的感受

在成长的路上,我们和很多业务人员、技术人员沟通,成为“平民数据科学家”不仅仅需要技术的敏感性、学习的耐心,也需要业务理解,这决定了每个人的结果差异。

1、了解业务,建立充满洞察的数据模型,比拥有大数据更重要

我曾经在一家成立十多年的零售企业工作,多年的数据模型止步不前,个人认为,一方面是工具理性不够透彻,比如止步在Excel阶段,而不能使用Pivot,甚至Tableau之类的大型BI工具去分析,从而无法建立基于大数据的逻辑;另一方面,也是最重要的,信息和数据的员工不了解业务,因此不能深入地理解业务的需求建立数据模型,只能止步在“业务需要什么,我给什么”的阶段。

那我们就只能依赖于业务部门提出详细的需求吗?此路往往异常艰难。业务部门的分析框架,多半局限在自己的视野之中,而且出于利益的考虑,往往还会选择性地筛选数据、分析数据、展示数据,数据的有效性层层递减。

因此,一个优秀的数据分析师,首先是业务专家在这一方面数据分析师要向会计师学习,会计师有国际通用的分析框架,业务却往往是每个公司都有自己千疮百孔的业务分析框架。精于业务的数据分析师需要了解业务,跳出业务部门的局限性,从公司的高度,参考行业的通用分析方法和框架,建立公正透明、重点突出、相互支撑的分析框架,进而借助BI工具建立数据模型,并在不断地分享中修改和升级。同时,有效地指导业务部门负责人使用数据模型的可视化图表,在他们看来可能魔幻、充满变化的可视化中寻找业务的问题和解决线索,实现数据洞察的价值。

我想,这才是数据分析师的修炼。对数据的洞察,比拥有数据更重要

数据分析.jpg

2、循序渐进,不断推倒重来

对于初学者,要有耐心不断地修改自己的作品,甚至推倒重来。以我学习LOD的经验,第一次的成功多半充满侥幸,第二次第三次的自然输出才是成功;而伴随不断的学习,只有推倒重来,才能从根本上迭代自己的数据模型,而不是在脆弱的学习成果上打补丁。

在这条路上,要不断的尝试使用新工具和新功能,比如Tableau新推出的“集值”(set action)可以根据选择实现部分高亮,进一步提高了互动效果;而Prep则让数据清理变得简单。不断使用新技术和新方法,日复一日,整个部门或企业的大数据可视化架构,就会日臻完善,随着时间的推移,数据带来的业务价值也会不可估量。

3、不断学习,日拱一卒

我买了很多Tableau的书,也确实有点好处,我依然认为最好的软件学习资料都在官方网站的学习和社区中。如果Tableau中文帮助有歧义,我就去找英文的help文档,总能找到你想要的东西。相对而言,读书应该多读方法论、实践案例和分析模型的书,比如《用图表说话》、《用数据讲故事》等。

  • 《大话数据分析》 2019年新出版,推荐作为入门和中级手册
  • 《人人都是数据分析师》 2019年第二版,让我大失所望,不推荐,第一本可以代替。
  • 《用图表说话》麦肯锡经典,学习如何选择图形,我最近一直在这个方向努力和总结
  • 《用数据讲故事》 故事是用来展示“为什么如此”和“如何做”的,不要停留在展示环节
  • 《深入浅出数据分析》深度普及统计知识和分析知识,推荐艰难地读一下
  • 《赤裸裸的统计学》了解统计的基础知识,推荐艰难地读一下
  • 涂子沛的书,可以了解BI的发展历史,培养对大数据的敏感和素养,推荐~

img_20190424_0719298204294331709344334.jpg

4、不断练习,以输出驱动输入

验证学习效果的好方法是实践,作为数据科学家,不断的把新方法和新工具应用于业务实践中,通过业务实践磨练数据分析的模型,不断修正真实的业务需求,是唯一也是最近的捷径。

随着业务的需要,我开始研究Tableau的嵌入式,也开始重新学习SQL,帮助自己更好的输出知识和Tableau服务框架。

5、一颗对数据敏感的心

数据分析需要统计学、概率论的知识,更需要一颗对数据敏感的心。知识是可以积累的,对数据的感觉却是在业务的真实环境中锻炼的。

 

四、跨界学习、逆袭成长

近年来,所有人都开始感受到了经济下行的巨大压力,就业环境变得越来越难。同时,数据挖掘和数据分析师依然是市场上最稀缺的岗位之一,在这样的环境下,“唯有知识让我们免于平庸”。

Tableau初衷是给业务人员设计的,而不是技术人员,这也是为什么我会如此喜欢;Tableau的基因就是让数据分析变得简单,让每个人都能理解和洞察数据的意义。

  1. 切不可盲目,过分自信是成功的绊脚石。虽说整体的印象和“试用性”的探索很重要,但是每个新行业都有我们不知道的基础知识,太基础了,容易忽视,却是这个行业的基石。金融学的基础知识P=C/r,一旦明白了,好多事情就会豁然开朗,但是如果自以为简单而绕行,就步入了荆棘之路。所以克里斯坦森建议说,遇到困难,他能给出的建议就是「回到原理」
  2. 应用性的知识没有「我以为」,只有you can, or you can’t.  文科的研究生可以把“论历史是一门科学”写成洋洋洒洒几万字,我当年也单凭分析两个词组academic power and academic authority 就发表一篇CSSCI。但是应用没有“我以为”,我觉得晚上看明白了,第二天还是做不出来书里的样子,那就是还没学好。谦虚的对待技术,否则它会立马回给你颜色。
  3. 永远相信,有更高效的方式,可以做好眼下的工作。对于离不开表格的人而言,Excel是冲锋枪,但是一旦迈过这个阶段,你会发现,数据可视化就是战斗机群啊。你见过冲锋枪敌得过飞机的吗? 这已经不仅仅是效率的问题了。
  4. 集中精力,攻克难关;不急不躁,按耐成性。

 

实践出真知,坚持生智慧。

 

2017年7月28日 第一版
2017年10月18日 第二版
2018年8月15日 修改
Mar 4, 2019 udpate
Mar 5, 2019

307390422.jpg