科技一周~The Age of AI

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




科技一周~The Age of AI

2014/08/02

下一个时代是什么?我想,那不会是最好的时代,也不是最坏的时代,只是个平凡的,历史早已注定的时代:人工智能。

2011年初春,午后阳光暂时偷走了硅谷里的料峭寒意,在山景城(Mountain View)的临街转角处,渐渐多起了行人,以及她们的低眉细语。我正坐在一间叫做Red Rock的咖啡馆里,却忽然看到一个机器人进来,径直走到前台,点了一块蛋糕。当咖啡师(Barista)故意询问它,“是在店内吃呢,还是带走?”,全屋子的人们都笑了出来。毫无疑问,机器人自然是要把蛋糕带回去给主人吃的。

这是一个令人轻松的场景,然而,其背后所蕴含的技术却并不轻松,其中涉及无线通信、实时视频的压缩与传输、自动控制,等一系列现代计算机技术。更进一步,如果,这个机器人能够完全自主行走,并自动问答,那么则需要图像识别、语音识别、自然语言处理、目标跟踪等一系列更有“深度”的技术来支撑。这些智能技术,在历史上也都曾陷入过停滞不前的境地,然而今天,随着底层硬件技术的成熟,它们又重新兴盛起来,再次成为科学家的研究热点。本周的新闻也正由此而来:

  • MIT媒体实验室的美女教授,Cynthia Breazeal,在众筹平台Indiegogo的项目,JIBO,在短短二十天里,就筹得近$140万资金,远远超过最初的$10万目标[1]。JIBO是世界上第一个家用机器人,它拥有呆萌肥圆的外型,像个小小多啦爱梦。目前,JIBO的主要功能是充当家庭的娱乐天使,提醒管家,和推荐助手,比如,在大家聚餐时,它可以担任摄像者;在小孩子睡觉前,它可以讲故事;当你今天有约会的时候,它可以提醒你;当你想吃饭的时候,它可以推荐你所喜欢的餐馆,并下单。JIBO的售价为$499,预计在2015年十二月推出。(我可以做个预测,JIBO迟早会成为Apple和Google竞逐的对象)
  • 如果说,JIBO是以卖萌带给人们欢乐,那么另一个有趣的机器人,hitchBot(搭车机器人)[2],则是以博同情来巧取人们的帮助。hitchBot像是一个其貌不扬、无家可归的孩子,站在公路旁边,伸出拇指,希望路过的人们可以开车载它一程。如果司机把它捡起来,放在车上,那么它会立刻与司机互动聊天,侃大山,讲笑话,当然也会告诉司机自己希望去的下一个地点。hitchBot是由加拿大的两名研究人员(David H. Smith and Frauke Zeller)设计的小机器人,他们希望hitchBot通过搭顺风车而独自走遍整个加拿大,目前这个小机器人已经行程近4000英里。

本周来聊一下在机器人设计中几乎必备的一项技术:目标跟踪(Object Tracking)。在上文中提到的两个机器人,都离不开这项技术,比如,JIBO通过内嵌的可以360度旋转的摄像头来捕捉并跟踪家庭成员的面容,然后根据脸部分析,拍下一张最好的全家福照片。那么JIBO是如何做到跟踪人脸呢?当然,第一步是要先识别出来人脸,关于识别的技术有待以后再讲。今天要讲的是识别出来之后的跟踪技术。

相对于识别技术,跟踪技术并不是在单一图像上实现的,而是利用了连续的多帧图像。可以说,如果图像识别是个二维技术,那么目标跟踪则是个三维(多了个时间上的维度)技术。当机器人在当前帧上识别出来某个物体后,那么它需要在下一帧里快速的“跟踪”上这个物体,并不需要重新分析整个下一帧图像(因为如果重新分析的话,那么速度就太慢了,达不到实时的效果)。在目标跟踪技术里,一个很关键的算法是运动估计(Motion Estimation),越快速地估计出下一帧里的运动方向,则可以越快速的跟踪上目标。

运动估计的算法有很多种,其本质上是一种搜索算法。在当前的硬件设计里,最常用的是基于块匹配的递归搜索算法:3D recursive search block matching[3]。这个算法是利用当前帧的运动向量值,在下一帧的几个备选向量里,搜索出来最匹配的像素块,从而确定下一帧的运动向量。这种算法在最初的几帧里,并不能找到真正的运动向量,但由于它的递归迭代性,当经过十几帧之后,估计的运动向量就会收敛到真正的向量值。通常,摄像头采集的频率在30~60Hz,也就是说,该算法可以在0.25秒~0.5秒的时间里跟踪上目标物体。这样的跟踪速度,基本上可以满足家庭的需要了。

 

[1]. JIBO, the world’s first family robot,  https://www.indiegogo.com/projects/jibo-the-world-s-first-family-robot , July 2014.

[2]. Brandon Griggs, Hitchhiking robot is halfway across Canada, http://www.cnn.com/2014/08/01/tech/social-media/hitchhiking-robot-hitchbot/, July 2014.

[3]. G. de Haan, P. W. A. C. Biezen, H. Huijgen, and O. A.Ojo, “True-motion estimation with 3-D recursive search block matching,” IEEE Trans. Circuits Syst. Video Tech., vol. 3, no. 5, pp. 368-379, Oct. 1993.

图2. [1].

图3. http://media2.s-nbcnews.com/j/newscms/2014_25/512356/140616-hitchbot-robot-1649_de262663d0cbc7ca1f7902450c8e9ee9.nbcnews-ux-760-800.jpg

(没有打分)

雁过留声

Comments are closed.