「May, 2019」 本文介绍了如何使用数据解释器修正常见的表格不规范,更多从Excel到Tableau的指南,欢迎参考进一步的白皮书:

数据解释器(Data Interpreter),从Excel杀手到Tableau强者的桥梁

很多人在使用Excel的过程中,形成了诸多不良的数据习惯,比如合并单元格、空白行、多个表头等;这些不良习惯影响了数据Tableau 的分析质量。我们很难说对错善恶,其实是两个视角的不同而已。

  • 领导人的视角:Excel要好看易读,嗯,“要看起来像Word”,“要有总标题啊”,“怎么能没有合计呢?”……新人陆陆续续被带到沟里
  • 数据分析师的视角:数据表达要严谨,Word是处理文本的,Excel是处理数据的;避免“九宗罪”(合并单元格、空白行、合计行、多个标题、数据割裂等)

虽然如此,提供标准的数据源是通往Tableau的必由之路。除了建议大家在导入Tableau之前适当的处理数据格式,Tableau也提供了数据解释器(Data Interpreter),协助大家批量导入不够严谨的数据表。

 

一、为什么使用数据解释器

在Prep之前,数据整理只能通过Desktop来处理,即便是复杂的数据整理也是。在推出prep之后,简单的数据整理可以直接通过desktop实现,复杂的则需要prep的支持。但在正式开始使用软件之前,我们还需要通过数据解释器来清理Excel的不当格式,比如多个标题、合计行等常见问题。

Data Interpreter 能够让您在清理数据时先拔头筹。它可以检测并绕过标题、注释、页脚、空单元格等内容,从而确定数据集中的实际字段和值。它甚至可检测到附加的表和子表,以便可以独立于其他数据使用数据的子集。

比如,我们有一个这样的数据,包含了双重标题、合并单元格,还有合计行等常见错误,如果要先在Excel中整理,显然有点麻烦,而且要保存两个版本数据。

pivot 表哥

在未使用数据解释器之前,Tableau会默认第一行为标题,并把第二行作为数据,这显然不是我们想要的(下图)。

数据解释器1 .png

二、使用数据解释器,修正常见不良习惯

在Tableau导入表格后,我们打开数据解释器,在desktop中,我们可以“查看结果”,打开被数据解释器修正过的数据。首先,我们可以看到这样的说明,通过不同的颜色来识别Tableau的处理过程。

数据解释器1的键.png

我们要特别注意列字段,浅红色会表解释为列标题——即便是多个标题行,也会被解释为一行,棒极了!浅绿色则是我们想要的数值。

经常,Tableau分不清那些“合计行”,因此需要在导入prep或者desktop后手动清除;总比错误的删除好方便一些。

数据解释器1的 标题行.png

此时,你在去看Tableau的数据源,之前的F1、F2……F12不见了,取而代之的是上面红色底色的标题。

神奇的Tableau,让我们处理数据游刃有余,效率成倍提高。关键是,不需要强制你(关键是领导)接受规范的数据逻辑。

破坏力极强的空白列

在Excel的九宗罪中,有一个极具杀伤力的是空白列,有人喜欢用空白列分割不同的主题,比如员工基础信息、薪资部分和员工扣款部分用两个空白列分割,从而打印显得美观;但是,这会阻断数据的关系。Tableau的数据解释器会用Null代替,同时根据数据区块生产多个子表格。

推荐大家提前把合并列删除,或者阅读官方说明(关于数据解释器)。

 

三、关于Excel与Tableau

在深入接触Tableau之后,你会逐步改变过去的Excel习惯;为了让更多的人了解“Excel九宗罪”,推荐大家阅读一本Excel的图书,这是十年前我的Excel启蒙书,也是进阶指南。

学习Tableau ,推荐也把前面两章熟读。

  • 书名:《你早该这么玩Excel》(上册)
  • 作者:伍昊

十宗罪 Excel .png

致敬周日;致敬Tableau。

 

2 Sep 2018  V1.0
by 喜乐君Healee