高效使用Tableau的数据提取

For 某某客户

From 喜乐君(吴玉鹏)

1、说明

Tableau支持实时数据库连接,数据提取到Tableau server两种方式;

当用户访问视图时,前者向数据库发起查询,并在数据库层面计算(表计算除外),后者是把数据库数据定时提取到server服务器,用户访问视图时,向Tableau server发起查询并完成计算。

2、提高数据重复使用效率的方法

1)很多人反复使用的数据源 “单独发布”

2)每天T-1及之前、高频查询使用数据提取,减少向数据库查询次数。

3、单独发布数据源,或者在发布工作簿时独立发布数据源

这里首先连接数据库的数据表,并创建一个工作簿

发布时,注意发布工作簿时,可以在数据源位置设置“单独发布”,或者在“服务器”—“发布数据源”单独发布,这样其他人无需反复连接同一个数据库并设置连接,后期可以统一设置提取。

如下所示,通过连接—tableau server,其他人可以共用同一个数据源。

3建议基于单独发布的数据源,设置提取

如果一个数据源每天被很多人访问,并且不需要实时(比如T-1销售数据,T-7过程转化数据等),那么可以在服务器设置提取。

如下,在工作簿中,找到对应的数据源,选择“操作”—“数据提取”,可以转化为数据提取。

z

设置提取之后,可以设置定时刷新计划。

4、每个人也可以在本地先做提取,并在发布时设置提取。

本地可以先提取,从而加速本地分析过程,强烈建议提取和“编辑数据源筛选器”结合使用,千万不要一下子把整个数据源select * 全部提取到本地,会占用过多的资源,而且没有意义。

建议可以提取适合分析的最小样本(比如做到同比环比,就可以删除两年前的交易)

强烈建议,可以通过 “隐藏未使用的字段”进一步减少数据量。

提取之后,发布工作簿时,会提示是否建立定期的提取。设置后,服务器会定时提取数据到server,从而避免频繁刷新数据源。

By 吴玉鹏(喜乐君)

发布者:喜乐君

喜乐君 | Tableau Partner,Tableau Desktop and Server QA Certification

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Google photo

您正在使用您的 Google 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s

%d 博主赞过: