因为热爱Tableau的关系,最近读了不少数据分析相关的书,今天介绍一本入门级别,但是学习之后众生受益的可视化指南——《用数据讲故事》,作者是前Google人力分析团队经理。

s29512382

一、推荐序与介绍

数据分析的目的是探索数据价值、形成业务洞见,因此最后的表现形式往往是具有故事性的,典型的逻辑大概会是这样的,“我做了一个怎样的假设……然后为此准备了哪些数据……在数据探索中使用了什么方法……根据数据发现的关联或趋势如何……下一步建议如何行动”。这种探索性分析是具有前后的故事脉络和情节的。可见,用故事思维做可视化的数据分析,会让我们的沟通更加高效、更直接。

如果我们把上面的故事性分析分为前后两个环节,可以定义为探索性分析和解释性分析。用书里的见解说,“探索性分析是理解数据并找出其中值得关注或分享给他人的精华,这就像在牡蛎中寻找珍珠,可能打开一百个牡蛎(尝试上百种不同的假设或者从上百种不同的视角审视数据),才碰巧找到两粒珍珠。”而解释性分析则是关于最后的两粒珍珠的,解释某一件事情或讲述一个故事。

「人们往往在应该进行解释性分析的时候(花时间将数据抽象为受众能够消化的信息:两粒珍珠)错误地进行了探索性分析(简单的展示全部信息:一百个牡蛎)。」

而这本书,是关于如何解释这两粒珍珠的,也就是如何把探索性分析发现的结论,以故事性的方式展现给别人的。基于此,本书提供了六个非常具体的建议。

  • 读懂上下文(context)
  • 选择合适的图表
  • 消除杂乱——这是中国式图表的天地
  • 聚焦受众的视线——灵活使用“前注意属性”
  • 像设计师一样思考——降低认知负荷
  • 用数据讲故事

 

二、读懂上下文

1、受众、内容和方式

同样的一个结果,对于不同的受众(总经理、部门负责人、客户)都会有不同的讲述故事的方法,因此首要任务是了解你的受众,知道他们想要听什么,然后用数据表达自己的出观点。

如果用投影、互动屏幕或者电子邮件的方式传递一个故事,也需要展现不同的内容才行。这一点,Tableau仪表盘给我们了充分的设计空间(广告😄)。

2、了解上下文(context)

了解上下文,就是了解背景,这样会更好的表达观点,如果知道因为去年干部调整影响了业绩成长,就应该把这些要素加入到分析中来,增强数据分析的客观性。

3、三分钟故事

好的故事要凝练,如果用三分钟讲完,我们应该怎么说?这是讲故事的人的水平。所以我特别喜欢一句话,引用如下:

“一个完美的设计,不是因为它没有多余的东西可以添加,而是因为没有多余的部分可以删减。”
——Antoine de Saint-Exupery “Airman’s Odyssey

故事最终的中心思想应该凝练为一句话,包含独特的观点,切中要害,而要要一句话表述。这有点为难可视化分析的新手了。不过对于做业务的而言,提出问题的人,应该用完整的寻找答案,并形成行动计划。

 

三、选择有效的图表

图表很多,常用的图表很少,高手在于用最简单的表述方式。常用的图表包括:简单文本(我们容易把最简单的忘记)、散点图、表格、折线图、热力图、斜率图、条形图、瀑布图、面积图等。

1、简单图形

1.1简单文本

当我们只需要强调一两项数据时,简单文本是最好的方法。在表格中突出一个数本身,容易出现误导。——拥有数据并一定需要图表。

1.2 表格

当我们和一群人沟通时,表格可以突出多个重点,让每个人找自己的兴趣点——表格展示细节。

不过使用表格时,要让设计融入背景,而不是被边框争夺了有限的注意力——推荐窄边框和空白。

1.3 热力图

热力图结合了细节和视觉暗示;通过使用颜色饱和度,可以帮助眼睛和大脑更快地捕捉兴趣点。

2、图表

表格与口头表达系统互动,而图表则是与视觉系统交互。
常见的图表分为:点图、线图、条形图、面积图。

  • 点图——散点图,散点图表述的是两个度量之间的关系和分布
  • 线图——折线图,有线的地方基本都有连续时间,因此表达的是随时间的变化趋势
  • 线图——斜率图,斜率图缩小了时间范围,用来对比两个时间段或数据点的变化。这个Tableau中单独分享。
  • 条形图——最常见的图,最常见于对比分析,又包含了堆积条形图(对比基础上增加了比例或变化),瀑布图(增加了变化动态)
  • 面积图——面积图比较少见,就像饼图,只有少量对比时推荐。

另外,作者提醒,尽量不要用饼图,坚决不要用3D图(反正Tableau也不支持),少用双y轴图(用标签或者两个图形更好)。

在这里,隆重推荐Tableau的图形白皮书,哪种图表软件是数据分析的理想选择?

英文版本点击这里,Which chart or graph is right for you?

赠送一张图,选择合适的可视化

WechatIMG16.png

四、杂乱是你的敌人

作者引用了一个词语,“认知负荷”,要感受听众的认知负荷:他们需要多少精力才能提取出信息。杂乱会增加负荷,因此是可视化的敌人。

  • 对齐:尽可能左对齐,引导注意力
  • 留白:适当的留白就像演讲的停顿,非常必要,不要为了数据而把视图填满!

作者提出了循序渐进去除杂乱的方法,非常使用,特别是改正我们的Excel习惯非常重要。

  1. 去除图形的边框
  2. 去除网格线
  3. 去除数据标记
  4. 清理坐标轴标签
  5. 直接标记数据
  6. 保持颜色一致

img_20181001_1056517899491264181525716.jpg

五、聚焦受众的视线

在消除杂乱之后,还应该有点什么去吸引受众的注意力呢?最好的方式是位置、颜色、形状、大小等这些“前注意属性”——非常容易引起我们注意的东西。为什么?

因为我们的记忆有三种:形象记忆、短期记忆、长期记忆。信息往往在形象记忆中保留几分之一秒,然后进入短期记忆;而形象记忆也能勾起我们的长期记忆,就像看到老照片就想起儿时一样。

——像位置、颜色等前注意属性,能够引导视线,从而在不知不觉中让受众看到我们期待他们看到的东西。

img_20181001_1103323202246832388459161.jpg

在文字中,也存在很多的前注意属性应用,比如加醋、红色文字、方框、下划线等等;
图表中,我们则可以把TOP单独标记颜色、特别标记等方法,从而建立信息的视觉层次。

img_20181001_1106565237707707719497378.jpg

在使用颜色的时候,特别注意不要用过多的颜色,而是少量使用颜色+渐变。

img_20181001_1130011728432238813796322.jpg

 

六、像设计师一样思考

可视化分析追求形式服从功能,也就是现有受众需要的数据目的,再有可视化图形表述过程。而设计师的设计都是功能导向的,不是为了设计而设计。在这一章节,做出突出了几个特别的要求:可供性、无障碍和美观

1、可供性

作者用这个词强调设计的固有属性,就像杯子的可供性就是更好的喝水,可视化的可供性则是清晰的表达,因此提出了三个建议:

  • 突出重要的内容

在《设计通用法则》中作者建议最多突出图表中的10%的内容,并突出了粗体、大小写和字体、颜色、字号等多种表达方式。可视化的重要也在于此,突出重点,引导注意力。

  • 消除干扰

就像前面所讲,消除干扰,是突出重点的重要一步,作者提出了一些具体的建议:

img_20181001_1117097109699579220811453.jpg

  • 不是所有的数据都同样重要!
    *当不需要细节时,请总结!
    *扪心自问去掉这个会有什么变化?
    *将必要但不直接影响内容的元素融入背景!
  • 建立清晰的信息层次

2、无障碍

  • 不要过于复杂,“如果难于阅读,就难以实施”,因此要保持图表易读、简洁,使用直观的语言,去除不必要的复杂。
  • 文字是你的朋友,深思熟虑的使用文字有助于可视化数据的无障碍表达,文字可以起到很多作用:标签、简介、解释、强调、突出、推荐、讲故事。

img_20181001_1120014215539540287972559.jpg

3、美观

做到美观,需要时间修炼,不过有一些建议值得我们不断联系。包括:明智的使用颜色、注意对齐、利用留白等,特别是颜色不要过度使用(超过三种以上就会争夺过多注意力)

img_20181001_1122121872256425357961145.jpg

 

七、讲故事与熟练使用的建议

在掌握了上述解释性分析的方法之后,我们需要完整的讲述一个故事,这需要创造一个清晰的开头(情节)、中间(起伏)和结尾(呼吁行动)的故事。清晰地呈现我们的故事,并利用冲突和紧张,以及重复的力量让听众牢牢记住。

 

可视化是介于科学与艺术之间的工作,需要的非常的耐力和美感,如何持续不断的提高技能?作者为我们提出了一些方法

  • 熟练的使用工具
  • 不断迭代并寻求反馈
  • 投入充足的时间不断练习
  • 从榜样中学习获得启发
  • 分享并寻找自己的风格

 

1 Oct 2018