科技一周~可以测知的世界才更残酷
作者 硅谷寒 | 2014-07-20 17:27 | 类型 硅谷科技周报 | Comments Off
系列目录 科技一周
科技一周~可以测知的世界才更残酷 2014/07/19 自古至今,人们对能够预测未来,并通晓过去的神,都有着敬畏之感。那么,这世上究竟有没有这种神?又或者,现下大行其道的机器学习技术有没有可能成为这种“神”?要回答这个深奥的问题,首先需要弄清楚另一个更深奥的问题,即:世界,究竟是不是一个可以观测(Observable)并可以控制的(Controllable)系统?“可观测”和“可控制”是两个计算机术语,通俗地讲,可控制性,意味着我们可以通过现有的信息预测未来的一切;而可观测性,意味着我们可以通过现有的信息,探知过去所发生的一切。也就是说,如果世界满足上述两个特性,那么它一定会被我们预测并探知。 然而,我却想再问一个略显“人文”气的问题:当我们真地面对一个可以测知的世界,我们人类是会快乐,还是痛苦?或许对于某些人来说,是快乐的,因为他们是这个世界的“成功”人士,当世界被测知出来,他们会看到自己那穷奢极欲享受无边的未来;然而,对于绝大多数人来说,这种可以测知的世界却是相当的残酷,因为在未来,他们依然是普普通通的屌丝,劳苦终日。这个论断是基于“富则愈富,穷则更穷”的大概率假设。 本周的科技新闻,也是从预测未来开始:
本期的科普,来聊一聊Google预测世界杯的机器学习算法。 对于任何一种机器学习算法,第一步都是要获取训练样本。Google获得的球员和比赛数据来自于一个专业的体育数据网站,Opta Sports。Google通过自己的Cloud Dataflow平台把来自于Opta Sports的原始数据进行预处理,再将预处理之后的数据导入Google Bigquery。第二步,Google Bigquery建立一个多层感知机(MLP,Multilayer Perceptron),通过样本进行学习训练。第三步,便是将下一场比赛的球员信息输入学习好的MLP,由MLP预测出比赛的结果。所谓的“预测”,其实就是一种“分类”,把输入的向量(参赛球员的数据)划分到两个类别里:胜、负。 这次预测世界杯的机器学习算法,是一种在线学习算法(Online Learning)。第四步,也就是最后一步,当该场比赛的结果出来,MLP立刻获知自己的预测是否准确,并根据结果进行自适应更新。之后,循环执行第三、四步,进行迭代,预测模型也将会在概率意义上越来越准确。 以上便是对世界杯预测算法的简介。当然,对于球迷而言,还是不要预测准为好,如果每场比赛都被预测准确,那么比赛就会变得索然无味,预先知道自己要失利的一方将会行尸走肉一样地踢完整场比赛。更甚者,这很有可能导致整个足球运动走向消亡。所以,倘若我们真地身处一个可以测知的世界,那么对于绝大多数人或事而言,就像是上了一列自动行驶的火车,纵然行驶的方向是万丈深渊,我们也无力改变。因为,这残酷,早已“天”注定。 [1]. http://googleblog.blogspot.com/2014/07/google-cloud-platform-predicts-world.html, July 2014. [2]. http://www.goldmansachs.com/our-thinking/outlook/world-cup-sections/world-cup-prediction-model-update-6-26-2014.html, June 2014. 图1. [2]. 图2. http://www.usatoday.com/story/news/nation-now/2014/07/18/malaysian-airlines-mh17-crash/12825433/
| |