在如何选择图表方面,《用图表说话:麦肯锡商务沟通完全工具箱》给了我非常好的建议,我想把这本书的精华分享给更多使用Tableau做可视化分析的朋友,从而在可视化方便有些许的进步。
- 【关键词1】基本视图:饼图、条形图、柱形图、折线图、散点图
- 【关键词2】相对关系:成分、项目、时间序列、频率分布、相关性
使用图表的一条黄金定律是,“越简单越好。”
本书分为三章,分别为“选择图表”、“使用图表”、“用概念及比喻说话”三部分。其中,第一部分“选择图表”给了每一个使用图表的人非常清晰而方便的入门之路,本篇读书笔记重点在于介绍第一部分。
-
图表与过程
作者把我们所见的各种图表概括为5种基本形式,分别为:饼图、条形图、柱形图、折线图、散点图。围绕这五种基本的样式,我们需要了解生成图表的基本过程是怎样的,这是关键。作者将这个过程概括为三步:
信息》》相对关系》》图表形式
具体而言:
第1步,决定你的信息(从数据到信息)
“在头脑中没有任何信息时去选择一个图表形式,就好像蒙起眼睛来识别房间的颜色。”选择用什么样的图表形式构建可视化,完全取决于我们想要明确表达的信息是什么。简单的说,“你所想要表达的主要信息决定图表的形式。”
比如说,面对公司上个月所有门店的销售经营数据,我们想要获得什么信息?我想要对比各个门店的经营质量(项目),鉴于不同的门店开业时间不同,我要对比他们的平均日销售和平均订单价,之后加以对比。
如果我修改了目的,我想要的是每周的门店贡献(成分),我就要用另一种方式,比如用表计算生成这样的占比图。
这里我不得不提一下我之前分享过DIKW模式,从数据data到信息information,是数据整理的过程,也是结果一部分。如果不能从庞杂无序的数据中提取到想要的信息,后续分析就会低效。更多可以参考另一片博客【Tableau】从“数据金字塔”到Tableau分析工作流 revised 。
第2步,确定相对关系(从信息到相对关系)
如果说上面的信息表述的是目的,我们最终展现的视图图形是结果,那么什么是中间环节和桥梁呢?本书作者用了一个形象的方式去表述——“相对关系”。
有一句话说,“没有对比就没有分析”,分析的目的就在于通过相对的关系寻找线索或者相关性,因此任何的一个可视化中都至少包含两个要素(而且至少一个度量)。分析可视化的需求,首先就可以问自己,“加入视图的要素的关系是什么?”
从信息到相对关系,作者说,“你决定的信息在一定程度上包含5种基本类别的一种:成分、项目、时间序列、频率分布及相关性。”基本相对关系,然后选择图表的形式。
1、成本相对关系
在成分相对关系中,我们在于的是每个部分的总额占比,比如上面每个周每个门店的贡献占比。这里就要用到Tableau的表计算功能。具体的可视化,一般会用饼图或者上面的条形图占比。
2、项目相对关系
项目中的部分是平等的,没有总体,因此项目相对关系一般是项目要素的相对比较,常用的则是柱状图。
3、时间序列相对关系
只要存在连续性时间,注意是“连续性时间”,一般就会分析随着时间的连续变化的变化,常见的关键词是波动、变化相关词汇。
只要存在连续时间,Tableau会默认生成连续的数据轴,另一个维度则是要素的变化。
4、频率分布相对关系
频率分析一定是基于数据的二次加工,因为数据中默认不会存在区间、数据桶之类的概念,因此需要确定分布的维度,然后按照分析的步长(比如每隔5岁为一个分析区间)生成频率分析用的维度。
最典型的频率分析就是直方图,在Tableau中可以使用“数据桶”的功能轻松实现。
5、相关性相对关系
相对性分析表明的是两个变量之间的关系符合或者不符合某种模式,常见的样式就是散点图。经常我们也可以从散点图中寻找异常数据。
关键词:与…有关、随…而增长、随…而下降、随…而改变、随…而不同、不随…而增长
第3步,选择图表形式(从相对关系到图表)
在确定了上述的相互关系之后,就可以据此灵活地选择图表形式了,比如成分优先选择饼图,时间序列优选线图等。
在第一部分的结尾,作者总结了几点内容,应该反复阅读明了含义。
- “图表是一种重要形式的语言。经过良好的构思设计后,与单纯的数据列表相比,它们能够更快更清晰地帮助我们进行交流。”
- “决定使用图表形式的既不是数据也不是方法,而是你的信息,你想展示什么,你想强调的重点。”
- “图表越少越好。只有当图标能够真正帮助你表达,使阅读者能通过它得到想要的信息时再使用它。”
- “图表是视觉性的辅助材料,它们并不成为你的文字以及语言的替代品。让它们帮助你表达出相应的信息,它们会起到很好的作用。”
Nov 8, 2018 Beijing