人生的ETL旅程:如何成为“数据贵族”

1、数据经济的奴隶还是贵族?

越学习,越敬畏这个复杂的世界,其中“隐藏”了拐卖和战争的邪恶,如今又面对疫情的挑战,“发展”的背后满是代价。

不过,从数据DATA的角度看,这简直就是一个黄金时代;卢梭当年关于人是“自然人”还是“社会人”的相对分析,如今了无意义,如果此时上天给每个人一个回归田园、悠然自得、放下尘劳成为“自然人”的机会,想必很多人都会拒绝。我们每个人都近乎无限地沉迷于互联网所创造的虚拟世界,虚虚实实,虚实相生,以至于开始忘记自己还是谁。相比宗亲、国家的认同感,互联网更是俘获每个人的“大网”,因此,每个人不仅仅是一个大写的“社会人”,而且成为了一个“数据人”。

人是生而自由,却无往不在枷锁之中。自以为是其他一切的主人的人,反而比其他一切更是奴隶。

——卢梭

每时每刻,每个人都在创造大量数据,同时也在消费大量数据。从这个角度看,每个人都是一家“数据公司”,有的人入不敷出,成为数据经济中的“奴隶”;有的人在创造内容贩卖,成为数据经济中的“贵族”。也许这就是沉迷于抖音和成为网红之间的差异吧。

从这个角度看,每个人都是数字经济下的基本单位,因此不仅仅是“数据人”,而是一个“数据体”(databody)——somebody with data in and data out。

2、如何成为数据贵族?

首先,认识到自己是一个完整的“数据体”,我们的职责是接受外部的数据——可能来自公司、媒体、国家和互联网的每个角落,而后输出高质量的数据。何为“高质量”?

其次,高质量的数据取决于数据内部加工的程度。我们每个人的头脑虽然不及intel/AMD/龙芯的CPU速度快,但是也有超乎它们的绝对优势,那就是抽象思考能力。因此,作为databody的人,数据输出的质量取决于内在的ETL过程——ETL是数据仓库中抽取、转换和加载数据的统称,我们内心也存在完全相同的过程。

想要获得高质量输出,既要有高质量的数据输入和加载能力(extract),又要将数据和逻辑思考、抽象思考、业务背景等知识实现最充分的结合、转换。这个过程是一个化学过程,而非简单的物理堆积。

再次,要把自己至于重要的地方,确保最终的数据输出是有价值的。上海的转和县城的砖虽然相同,但作用大不相同;想要融入这个世界,又躲不开螺丝钉的命运,那就努力做一个关键位置的螺丝钉。

从这个角度,我们可以理解“抖音网红”“直播卖货”和沉迷于新闻、微博的“数据体”之间的差异,它们有截然不同的ETL过程,也就注定了不同的生活和命运。

我这几年的幸运,无法是多年的输入,在一个特定的环境下高度集中转换迸发的结果。我的科研背景、业务从业经历、国学和佛学历程以及计算机敏感度、持续的阅读,奠定了最基本的输入要素,然后在逻辑思考的加工下,设计了业务分析的框架、从问题到图形的可视化分析方法,并将继续奠定我在数据仓库等方面的理解。

3、一起交流,奠定未来五年格局

基于这样的思考过程,最近计划组织一个线下的“成长交流活动”,我就悉数分享自己的数据成长经历,特别是近几年典型业务案例的全过程。对于自己,这是一个二次反刍的过程,二次的回顾和升华;对于参与者,这将是一次掌握完整的“数据体”方法论的过程。

当然,时间未定,地点未定,费用未定;机缘俱足,携手出发。

@喜乐君

发布者:喜乐君

喜乐君 | Tableau Partner,Tableau Desktop and Server QA Certification

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s

%d 博主赞过: