在Tableau Prep刚刚推出正式版且只有英文版本时,我勇敢地试用了这款Tableau的分支产品,被它“可视化数据清理”的设计所折服,特别是它的Flow,让人感觉不觉得这其实是高科技产品。

屏幕快照 2019-01-21 下午11.14.08.png

在我学习并写完四篇Prep的使用文章之后,我慢慢放下了Prep这个软件,一来它的惊喜并未解决所有的问题,只是短期缓解了数据清理的疼痛,二来在使用过程中遇到了太多的小惊喜,还有让我的MacBook Pro吃不消的高耗能。

最近下载了最新版的2019.1,打算把一个客户的数据库分析从本地转移到server,通过更新数据库代替频繁的更新可视化仪表盘。没有想到几日不见,新版本的prep让我颇为惊讶,特意分享于下。

1、自动更新通配符并集,再也不用“假装编辑”了 (2018.3.3)

添加新文件时自动刷新输入并集

如果在输入步骤中使用通配符模式来查找和合并 Microsoft Excel 或文本 (.csv) 文件,则在下次您打开流程或通过命令行运行流程时,添加到同一文件夹中、与模式匹配的新文件会自动包括在并集中。

在使用Prep时,我频繁的用通配符去合并多个表格,但是之前每次打开,都不能自动加载新增加的文件,只好“假装修改”通配符内容,比如把“门店订单信息”改为“门店订单”,确认重新加载数据之后再改回去,不甚其烦。好在新版本及时更正了这个问题,打开prep文件,自动刷新并集,Perfect!

屏幕快照 2019-01-22 下午10.26.35.png

2、可以复制、粘贴频繁的“数据清理”动作(2018.3.3)

重用清理操作

在清理数据时,您通常会在整个流程中反复执行相同的清理操作或动作。为了使数据的清理和调整更加高效,我们添加了在整个流程中复制和粘贴这些操作或动作的功能,这样您就能执行清理操作或动作一次,然后在需要的地方重用该操作或动作。

就像Office的“格式刷”一样方便,现在可以复制、粘贴清理动作了,超级好用。包括三种方式:

  • 在flow中复制一个步骤step,然后粘贴到另一个flow中;
  • 在changes更改中复制一个更改动作,然后粘贴到另一个flow或者当前flow的其他字段中。

:Users:wuyupeng:Desktop:屏幕快照 2019-01-22 下午10.32.22.jpg

3、增强的右键高级操作

新版本不仅增加了“移除空格”、“替换为NULL”、“仅显示无效值”、各个地方都可以灵活的“添加说明”、右键一次性删除多个flow步骤,还可以在flow中右键查看所有的步骤,并提供快捷的处理方法,而不需要到数据面板,这个功能超赞。

不过,如果能够把同样的问题合并,比如说下面的所有能一次性移除,就更好了。

屏幕快照 2019-01-21 下午10.44.08.png

最重要的是,Prep支持和Desktop中一样的数据角色,特别是地理角色,这样可以无缝对接Desktop的分析而无需事后设定。而美中不足的是,现在还不能直接把经纬度指定为经度和纬度坐标,只能先作为数值,到desktop再编辑地理信息。

Tableau Prep 支持以下数据角色:

  • 电子邮件、URL
  • 常见的地理角色(基于当前地理数据,并且与 Tableau Desktop 使用的数据相同)
    • 城市
    • 国家/地区
    • 省/市/自治区
    • 邮政编码

 

4、在任何步骤中应用清理操作 (2018.3.1)

修复流程中的问题更加高效。现在,如果您在联接、合并、转置或聚合时发现数据中的问题,您可以直接在该步骤中修复这些问题,而不必添加额外的清理步骤。

在更多的地方更加灵活的使用清理功能,Prep会自动帮你保存更改记录到合适的位置。

新版本逐步增强了“说明”的功能,从而有助于团队之间的相互沟通和协作。

 

Prep正在快速成长,之前我建议企业客户尽可能先不要把prep用于正式环境,毕竟脆弱性超过想象,这几天我用prep+desktop做了一个客户分析,明显感觉有了非常大的提高。下一步,我想可以把Prep作为“表哥表姐”的 Excel Pro来推广了。

Excel带我们进入了数据的世界,而Prep带大家在大数据世界真正的飞起来。

 

Jan 22, 2019