近期陆续开始重新学习Tableau,我的最爱。

一、新建数据源和数据准备

在数据源界面,完成必要的数据整理,对于后期提高效率,非常重要。没有数据整理,就没有数据的高效分析。《哈佛商业评论》曾经发表一篇文章说,数据分析师在用80%的时间做整理,只用20%的时间在做分析。

屏幕快照 2018-08-24 下午3.03.43

//去年我写Tableau 的系列博客时,prep还没推出,当时确实被各种数据整理的工作弄的特别沮丧。现在回头,很多的文章都要重新改写,因为Tableau  Prep为我们提供了更方便快捷的道路!大爱Prep!自从有了prep,Tableau可以自豪地说,我们可以让数据分析师用20%的时间去做整理,而不是80%!多么振奋人心的消息。

屏幕快照 2018-08-24 下午3.03.27

  • 并集、通配符
    • 新建数据源几乎都会用到并集,也就是几个数据格式一致的sheet组合一个数据源;但是只有当这些sheet在一个工作簿中才有效;
    • 如果文件非常多,每个文件都会有想要的拼合的文件,那就要用到通配符建立数据连接了。走了点弯路,很好用,详细可以见后面的这篇博客。(「Tableau」使用通配符,跨工作表建立数据连接
  • 提取数据(数据筛选的优先级)
    • 数据提取不是必备的,但是当数据很多时,建议使用数据提取,加快操作;
    • 数据提前时可以添加筛选器,比如不提取单据状态为“未完成”的单据,就会在以后所有的数据中都避免了未完成的单据。数据提取阶段的筛选器,在全局中优先级最高。
  • 数据准备(修改字段格式,隐藏不必要字段等)
    • 很多初学者会现用现改,我后来觉得应该早处理。
    • 把维度字段和度量字段区分开来,把时间字段用时间格式显示,还有地点(用在地图上)
    • 隐藏不必要的字段。

二,环境指南

  • 了解数据源
  • 了解工作区
  • 整理标题字段

三、了解Tableau核心概念

  • 数据类型
  • 字段类型
  • 操作顺序

 

 四、了解Tableau数据操作顺序

这是学习Tableau的必备知识,我刚开始忽视了,后来出错,才知道了解背后的逻辑是多么重要。

数据分析的数据操作是不断叠加的,就像是PS中的图层,比如数据提取筛选器最先执行,就就相当于PS的底层,数据视图层面的上下文筛选器相当于第二层,它在底层的基础上进一步筛选。其他类似,一步步递进。

我在官方指南(英文)基础上做了一个导图,最上面的最早被执行。

  • 筛选器和计算的位置
  • LOD详细级别表达式

五、熟悉Tableau的计算

计算是大数据分析的核心之一,计算构成了可视化的逻辑。

表计算

 

我的Tableau学习集

学习经验类

LOD专区

专业实操类