大数据跟“所有人”什么关系(上) ——写给“普通人”看的“Big Data Concerns You How”

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




大数据跟“所有人”什么关系(上)

——写给“普通人”看的“Big Data Concerns You How”

 

写在前面的话

很少见地,这是一篇散文。(之所以少见,是因为笔者在求学的那些年写所谓的“考试作文”,写散文从未得过高分——彩笔从未排除是评判标准的问题。)

 

一、我有一个朋友

该青年在广州某大型政府投资性企业工作,为人靠谱(我会乱说),领导看好,目测有一个Promising的将来(我其实不懂,不过少女们弱弱地发一下花痴就好,此人已订婚)。

这样一个朋友(本应跟彩笔的二笔人生毫不搭界),偶尔会以请吃饭为诱饵,创造机会跟笔者扯一段什么是大数据之类的话题。可见他原本的工作内容、以及社交圈子跟大数据的相关程度有多稀疏;也可见他是有多绝望——找到彩笔这种边缘人。

这个朋友代表这样一类人:

1. “社会意识”开始觉醒;

2. 部分精神世界开始脱离低级趣味;

3. 有意愿跻身于“大数据”这个ongoing时代潮流中;然而,

4. 无法摆脱“术业有专攻”的桎梏,“专业能力”不对路,至少目前做不到为“大数据”的宏伟蓝图的实现添砖加瓦。

若是在以前(对不起,彩笔也不知道至少要追溯到多久之前),“隔行如隔山”,现如今这种大范围的跨行业“乱入”应该完全不能想象吧。所以,《世界是平的》这种内容的书会成为比尔盖茨推荐的畅销书,还竟然可以“再来一本”。这种现象的出现,也便由意料之外,变为情理之中了。

这个又热又挤又平的世界,好像可以让人不费吹灰之力就可以看到其他行业的人在忙什么。这种零高度差创造出一种“好像很容易”、“我也可以做到啊”之类的幻觉。于是,越来越多的人开始觉得,自己就是那个厨子,以为“不想当裁缝的司机,不是好厨子”的励志的句子说的正是自己。

笔者本想说,每个人做好自己的本分就够了。然而转念一想,如何在这个扁平的毫无遮拦的世界里界定“本分”?有难度。同时,作为一个自由主义者,笔者坚定地维护每个人“天马行空”、“异想天开”以及做任何不切实际的梦的自由,即便倾向于以结果为导向的笔者找不到论据JUSTIFY他们的各种妄想。

因为上文的种种(也会因为下文的种种),每次SENSE到这位大叔是要FEED有关大数据的内容而请求见面时,彩笔黄就会很纠结。且不说彩笔能说出来的东西不多,彩笔也更加不知道大数据concerns him how,不知道要跟他说什么。钱可以浪费,但粮食不能浪费。这样的饭,彩笔吃不下[委屈]。

 

二、我有一个同学

笔者求学期间的一个同学,现在是鄙人母校的在读博士。当年(2012年6月末至7月初的时候),我们是一同在武汉大学图书情报与档案管理研究生暑期学校的讲座上,听张李义老师的讲座“大数据背景下的信息处理工具与方法”。有生之年for the first time,聆听有关“大数据”的福音。自那时始,大数据便渐渐“走进了彩笔的内心深处”,扎根下来,变成了彩笔黄的一生挚爱,谁都抢不走。然而,截然相反地,这位同学却在随后的时间里,走上了一条几乎完全相反的路。用她的话说:大数据对于我们这种没有数据处理技术,没有数据处理设备,更压根就没有数据的(一般)人来说,就是个坑(绕着走)。”

 

/*下面是一段插叙*/

笔者在之前的一篇文章中提到过(我就是不说是哪篇),大数据不过是在新的技术水平下,某旧物展现出来的新姿态。所谓“老树发新芽”。“老树”是经典的数理统计理论,以及在漫长的实践过程中添加和反复验证的方法体系。“新芽”便是分布式、云计算这些我本身就一知半解、说出来你以为你懂但其实你根本不可能懂的“新技术”了。

如果一定要用一句简短的话表述什么是大数据,笔者会选择:大数据即全部的数据。”

什么是“全部的数据”呢?假设你经营一家上世纪八九十年代的“小卖部”,售卖烟酒糖茶等种类有限的货品。这时,“全部的数据”可以是每种货品的成本、单价、销售、库存等等(抱歉笔者并没有实际经营经验,这里只是列举几个作为例子,看官可结合自身丰富的经验自行脑补“等等”的部分)。然后,继续假设你经营的是一家21世纪的跨国连锁超市,对于你来说“全部的数据”仍然是:每种货品的成本、单价、销售、库存等等(注:一个字都没有改动哦)。

是的,我们惊喜地发现了,这个以数据命名的时代(“大数据时代”)并没有新数据的诞生。或许一些行业的资深业内人士仍然能够想到一些现在“能看到”并且当年“看不到”的数据类型。彩笔黄的解释是,这种数据类型或许是新的,但是这些数据类型所描述的对象是一直存在的。(有些诡辩了是不是)

这些业内人士的疑问可以很好的引出我们的下一个环节:是什么让这些新的“数据类型”诞生(成为可能)?答曰:“(新)技术。”

彩笔实在是不想讨论什么是大数据,所以以上内容虽未得尽表,但也到此为止。

/*插叙的内容结束*/

 

终于回到我的同学这里。虽然我们分别决定走上不同的路,但是我们对大数据的一些基本认识是一致的(上述插叙的内容啦)。她之所以决定绕路,是因为认识到大数据的门槛其实很高(在这个普遍认为“THE WORLD IS FLAT”的人世间,能意识到这里实属不易)。而她本人的兴趣、专业的技能等,不足以将她提升至与大数据共舞的高度。

 

 

写到这里,笔者决定暂且告一段落。总结一下文章进行到这里的思路:

在文章中,笔者介绍了笔者身边两类人的代表,描述了他们对于大数据的态度(趋之若鹜VS避之唯恐不及)以及这种态度的形成过程。期望是能够引发有关Big Data Concerns Everybody How的思考。这两类人即便不能完全cover现在社会上的所有人,“所有人”都可以在这两个分类中找到部分自己的归属感。接下来便可以自行思考Big Data Concerns Yourself How了。因为笔者确定有下文,也确定下文的内容与解答这个问题完全无关(突然觉得这个系列——虽然确定下来只写上下两篇——应该叫做“彩笔黄的价值观输出”)。

(12个打分, 平均:1.00 / 5)

雁过留声

“大数据跟“所有人”什么关系(上) ——写给“普通人”看的“Big Data Concerns You How””有1个回复

  1. Ivey Huang 于 2014-06-29 2:36 上午

    给分的同学什么意思呀-_-|||