科技一周~魔幻现实主义

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享

科技一周~魔幻现实主义

2014/10/25

在文学界风行了近百年的“魔幻现实主义”,也终于要被科技狂人们带到每一个人的眼睛里了。随着可穿戴技术和虚拟现实技术的发展,越来越多的初创企业试图发展出融合了两种技术的新产品,以期达到一种“超越现实”的目的。最著名的例子,就是前不久被Facebook收购的Oculus Rift。本期科技一周的主题,也正与“魔幻的现实”相关。当然,在谈及令人兴奋的“魔幻”之前,我们先来看一则受困于“现实之无奈”的新闻。

本周,IBM宣布把自己的芯片生产线(Fab)全部“卖”给GlobalFoundries,并且还倒贴对方15亿美金。硬科技时代的启幕者,IBM,正在渐渐地远离硬科技。这其实也没什么可指责,毕竟它已经103岁,相对于那些正击水弄潮的互联网新贵们,太老了,是该退下来,到海边的别墅里数一数自己的退休金了。让我们来看看,这些年IBM都变卖了多少硬科技家产[1]:2002年,硬盘业务;2004年,个人电脑业务;2007年,打印机业务;2014年,X86服务器业务;2014年,芯片制造业务。无怪乎,科技界人士说:IBM不再是科技公司,确切地说,它已经是个金融服务公司了。也许,这就是现实的无奈:在互联网这幢金光闪闪的大厦里,硬件只是地基里那几块儿灰色的砖头。

另一则倍受关注的科技新闻是,Magic Leap获得了5亿4千万美元的B轮投资,由Google领投,Qualcomm跟投[2]。Magic Leap,这家位于Florida的初创公司,在此之前,一直默默无闻,几乎找不到任何相关的报道,此番获得巨额投资,可谓:一朝成名天下知。昨天刚刚接过Google大权的Sundar Pichai(掌管除YouTube之外Google的所有产品线),和Qualcomm董事长Paul Jacobs将加入Magic Leap的董事会。这两位科技界重量人物的参与,显然说明Google和Qualcomm对Magic Leap的技术有着极大兴趣。那么,问题来了,Magic Leap到底在开发什么产品呢?

虽然,Magic Leap的CEO,Rony,在接受媒体采访时,对自己的产品尽量保密,但我们还是可以大概猜测出来:Magic Leap一定是一款可穿戴的虚拟现实设备,不,确切地说,应该是“魔幻现实”设备。Rony在谈到Oculus Rift(几个月前被Facebook收购)时,显然认为自己的产品比之格调高出许多。他认为,Oculus Rift仅仅是虚拟现实,也就是说,用计算技术构造出一个完全虚假的场景,并通过头盔展示给人们,而Magic Leap将会把人脑“想象中”的场景与真实的世界完全融合起来,达到一种魔幻的超现实的(Magic Realism)境界。其实,通俗点,Magic Leap就是一种“三维实时的自动PS”技术:)

举个例子来说,当你在海滨游乐场日光浴的时候,突发奇想,如果有一只巨大的虎鲸窜出来,将会是怎样的情景呢?好的,你现在可以戴上Magic Leap的设备,来欣赏一下你脑海里的想象与现实相结合的情景:一只虎鲸从海水里飞跃而出,震撼了整个海滨游乐场!这个场面,我们曾在《少年Pi的奇幻漂流》里见到过,但如果有了Magic Leap,我们可以随时随地沉浸在自己创造的“魔幻现实”里。

从图像处理的角度来说,Magic Leap是一种图像合成技术,与虚拟演播室,或者电影里看到的特效合成技术类似。当然,Magic Leap与它们还是有一定区别的,在电影特效里,大多通过前景传感器定位技术,把前景目标与背景合成起来,而Magic Leap因为受限于设备的穿戴性和处理的实时性,不可能给虚拟前景加装传感器。至于Magic Leap将采用什么样的定位技术,把前景与背景“完美”的合成起来?我也只有等到它发布之后,再做深入研究了。
[1]. http://en.wikipedia.org/wiki/List_of_mergers_and_acquisitions_by_IBM

[2]. http://techcrunch.com/2014/10/21/magic-leap-tech/

图1. http://www.deshow.net/cartoon/michael-parkes-magic-realism-paintings-720.html#pic

图2. http://media.economist.com/sites/default/files/cf_images/20070407/D1407SB1.gif

图3. www.magicleap.com

(1个打分, 平均:1.00 / 5)

科技一周~灵魂的星空

灵魂的星空

2014/10/18

站在十月的夜色里,抬眼是迷离的星空,漫天光点,流明虚度。我,似醒非醒,若梦非梦,足下所立,不知是恒河的浅湾,还是灵魂的虚谷?想起了,梵高的星夜(The Starry Night),和那漩澓的湍流,正像是一个个创业者的灵魂,在卑微与束缚里追逐着星空与梦想的极限。

本期的科技一周,重点介绍创业公司。

  • 上周末,我在Atherton见了一个90后的创业团队:RavenTech(渡鸦科技)[1]。他们正在试图打造一个应用程序(App)的平台,或者说是“App的入口”,以“信息流”(Project Flow)的形式完成人与人在手机上的互动。当下,人与人在手机上的交互方式是“多层应用模式”,举例来说,假如A要约B一起去吃午饭,那么将会涉及这样一套繁琐的交互流程:

1. A打开微信向B发邀请;

2. B回应OK;

3. A切换到大众点评,找餐馆信息,并发给B;

4. B回应OK;

5. A切换到Phone App,向餐馆打电话预约餐位;

6. 最后,A切换到地图应用,去餐馆。

在这一流程里,A先后打开了四个应用:微信、大众点评、Phone App、地图应用,在其中频繁切换。倘若使用RavenTech的ProjectFlow平台,那么这些应用都会被“链接”在一起,共同使用ProjectFlow统一的“信息流”界面,整个交互过程如下:

1. A打开ProjectFlow,向B发邀请(ProjectFlow自动调用微信);

2. B在ProjectFlow里,回应OK;

3. A在ProjectFlow里查找餐馆信息,发给B(ProjectFlow自动调用大众点评);

4. B在ProjectFlow里,回应OK;

5. A在ProjectFlow里,打电话预约餐位(ProjectFlow自动调用Phone App);

6. A开车去餐馆(ProjectFlow自动调用地图应用)。

我们看到,新的流程里,A不需要在应用之间频繁切换了,所有的信息都会以“流”形式展现在A和B的手机上,就像是两个人在自然的对话。也就是说,ProjectFlow在后台自动完成了之前需要A手动切换应用的工作。这种交互方式,更加简单,人性化。除了Project Flow之外,RavenTech正在把类似的技术应用到手机的音乐播放器上,这被他们称之为“MusicFlow”。感兴趣的读者,可以在这里下载:[2].

  • 近日,Linkedin发布了2014年度湾区10大最吸引人的创业公司[3]:

1. Lytro(图像,高端照相机)

2. Theranos(医疗,验血机)

3. Fitbit(穿戴式设备,手环)

4. Coursera(在线教育)

5. Minted(O2O装饰)

6. Wealthfront(互联网金融,自动化财务投资)

7. Bromium(企业数据安全)

8. Twilio(云通讯)

9. Engyte(企业级云存储方案)

10. Leap Motion(新型人机交互设备)

Lytro,这家排名榜首的高端照相机公司,刚刚融资了四千万美元,给员工的待遇也最为优厚,工程师的薪水约在$125000~$147000。排名第四的Coursera,在创始人Andrew Ng被百度强力“挖走”之后,聘请了耶鲁大学的前校长,Rick Levin,担当CEO。自此之后,Coursera被戏称为“常青藤校长们的最佳下一站”。排名第六的Wealthfront,是一家集结了花街金融精英和硅谷软件精英的互联网金融公司,主要为高科技中产人群提供自动财务投资服务。Wealthfront这两年的发展速度十分惊人,从不到1亿美元的基金增加到了10亿美元。

下面,让我们来总览一下这份榜单。可以说,这是一个相当“杂乱”的榜单。从榜单上,我们几乎看不出什么趋势来,或者什么技术最火爆,什么市场是VC投资的重点,因为,十个热门的初创公司几乎分散于十个不同的细分领域。然而,我个人认为,这种“杂乱无章”,才更应当是创业的特点。创业公司应该基于创业者的灵魂而生,不应靠模仿“抄袭”他人而生。如果创业者都追逐自己内心的创意灵魂,又怎会出现在同一个领域里有几十家公司的局面?

创业的天空上,繁星无数,每一颗都独一无二,与其说那是他们的光芒,不如说那是他们的灵魂。

 

[1]. https://www.youtube.com/watch?v=lKf9pCDc9tk&feature=youtu.be

[2]. https://play.google.com/store/apps/details?id=cn.raventech.musicflow&hl=en

[3]. Cromwell Schubarth, These 10 Bay Area startups are tops among tech job hunters, http://www.bizjournals.com/sanjose/news/2014/10/01/these-10-bay-area-startups-are-tops-among-tech-job.html?page=all , Oct 2014.

 

图1. Vincent van Gogh, The Starry Night.

图2. [1].

图3. www.lytro.com

(3个打分, 平均:3.67 / 5)

科技一周~天与海的落差

科技一周~天与海的落差

2014/09/07

“中秋,天涯风冷,沧海月明,潮起又潮息,花开复花灭,一万年的牵挂,却隔着天与海的落差。”这落差,若放在上古神话里,那是在说嫦娥与后羿的凄美;若放在科技圈里,则是指“天上”的Apple正藐视着一大群掉在“海里”的追随者。

明天,Apple将会发布重量级产品,几乎所有人都笃定了iPhone 6和iWatch。这着实令许多厂商“牵挂”万分,深恐iWatch一出,独霸头条,自己的产品难免落到汪峰之地步。于是,几大厂商赶集似地,一起抢在Apple之前推出了智能手表:

  • 本周三,德国柏林,Sony推出了第三代智能手表SmartWatch 3和腕带SmartBand Talk。就在同一天,三星推出其本年度的第六款智能手表:Gear S。此前5代分别是:Galaxy Gear,Gear 2,Gear Fit,Gear Neo,Gear Live。我只能用“疯狂”两个字来形容了。一年之内,能连甩六代产品的公司,当世之上,除三星外,再无它。本周四,LG推出G Watch R,主要的宣传亮点是“第一款圆面智能手表”。同一天,摩托也推出圆面的Moto 360 SmartWatch,但由于时差的关系,晚了LG半天。这四大厂商的智能手表,在功能上,大同小异;在外观上,按照Engadget上[1]的说法,它们最大的共同点就是:Ugly。我们只需再多等一天,就可以看到Apple与这四家公司那“天与海”的落差。一言概之,智能腕表,更应该注重的是时尚性,而不是纷繁复杂的功能。
  • 除了上面的终端厂商争先恐后玩起穿戴式设备之外,作为芯片业老大的Intel也挤了进来。本周,Intel不仅自己推出了一款智能手环[2],还宣布与Fossil结盟,共同开发穿戴式设备[3]。自2007年以来,Intel彻底输掉了移动芯片的世界,但它不想再输掉下一个千亿级的世界:物联网(IoT,Internet of Things)。于是在今年初的CES上,Intel隆重推出了其IoT平台:Edison(以著名发明家爱迪生的姓氏命名)。穿戴式设备自然是IoT里一个重要的分支。此番,Intel想借力Fossil的时尚特点,来发力IoT,从思路上来说是非常正确的,但唯一的问题是,Intel品牌自身的“反时尚性”。这种“反时尚性”,其实也是整个半导体行业的“原罪”。因为,半导体芯片距离终端消费者太过遥远,所以芯片企业几乎不可能像互联网企业或终端企业那样,直接给消费者以时尚视觉的冲击。如果Intel不能重塑自身形象,与其大张旗鼓地推出刻有自身品牌烙印的终端设备,还不如像MTK那样,默默地做其它品牌商的供应商。

既然谈到了IoT,那么今天,我就来为大家简单介绍一下当前比较流行的IoT方案。总的来说,当前的主流IoT方案是由四家芯片厂商在推动,其中Intel推出了两套方案。这些方案分别是:Intel Edison,Intel Gateway,Qualcomm IoE(Internet of Everything),Broadcom WICED,Marvell Wifi-MCU。它们的特点见下表。当然,由于IoT还在快速的发展当中,这些平台的变动也非常大,每隔一年就会有许多新的特性被增加进来。

Intel

Edison

Intel

Gateway

QCOM

IoE

BRCM

WICED

MRVL

Wifi-MCU

面向市场

消费类电子

企业级产品

消费类电子

企业级产品

消费类电子

消费类电子

企业级产品

通讯整合度

单芯片集成

Wifi,Bluetooth LE

需另配

通讯芯片

单芯片集成

Wifi, Bluetooth LE, 3G baseband

单芯片集成

Wifi, Bluetooth LE

单芯片集成

Wifi, Bluetooth LE

(支持ZigBee协议)

CPU

X86-Atom

X86-Quark

ARM Cortex-M3

ARM Cortex-M3

ARM Cortex-M3

兼容平台

NA

NA

NA

Apple HomeKit

Apple HomeKit, Google Chrome OS

References
(3个打分, 平均:3.67 / 5)

科技一周~看看美丽的世界

科技一周~看看美丽的世界

2014/08/31

有一年,我们全家去太浩湖(Lake Tahoe)旅行,却遭逢一场暴雪,娱乐场所自然全部关闭了。当我们被困在旅馆里,无聊已极的时候,我三岁的孩子突然说道:“请打开窗帘,让我看看美丽的世界。”那一瞬间,我被这稚嫩直白的语言所触动,旋起了窗帘:眼前是一番究极的冰冷,玉树琼枝,凌花飞雪,掩埋了整个世界的俗气!这些精致渺小的雪花,竟勾勒出了无穷无尽的美丽。那一刻,我,比一粒雪花还渺小的存在,只是站在这世界之外,静静地欣赏着。

本周的科技新闻就带大家来看看我们美丽的世界。

  • 首先为我们掀起“窗帘”的是一款旅行照片分享工具,Tripcast。这个App是由Cluster(一个隐私照片分享App)团队发布[1]。然而,与大而全的Cluster不同,Tripcast具有更强的针对性。可以说,在理念上,Tripcast是一个“垂直”照片分享工具,专门面向旅行者。Tripcast更加强调地图与照片、视频、文字的结合,以及更加直接有效的信息流。举例来说,如果在Cluster或Facebook上,你的好友分享了某个景点的图片,那么几乎可以肯定的是,这些图片会被更多其它杂乱无章的图片所淹没,因为Facebook上的信息量过于庞大。但在Tripcast上,由于限定了景点与图片的结合,所以你看到的全部都与旅行相关。Tripcast的理念,或许会带来一波“垂直”信息流的浪潮。
  • 下面这则科技新闻,可以让我们在灾难发生的时候,有更大的几率重新回到美丽的世界。上周日凌晨,一场6.1级地震袭击了硅谷北部的酒乡小镇,Napa。然而,在距离Napa 40英里的伯克利大学里,一个地震预警系统(EES:Earthquake Early Warning)却在地震发生前的10秒钟,就已经捕获了地震波[2]。在2030年之前,硅谷发生一场6.7级以上地震的概率超过70%[3],而整个加州,则会有更大的概率发生强震。因此,去年,加州州长签署了一项法令,将耗资八千万美元,在2016年之前建成一个覆盖全州的地震预警系统。可以肯定的是,预警系统与移动互联网的连接,将会在抗震时发挥重要作用。一旦地震来袭,随身的智能设备将会给我们争取到宝贵的10秒钟,这足以挽救无数生命。
  • 与伯克利专业级的地震预警系统相比,斯坦福大学的Quake-Catcher Network(QCN)则显得更加顺应当代“开源/众筹的精神”[4]。Quake-Catcher Network是一个世界性的公益协作项目,其目的是在全球建立起一套最大的,最廉价的,地震监测网络。只要你有一台接入互联网的笔记本电脑,你就可以免费向斯坦福大学申请一个地震传感器,当把这个传感器连接到笔记本上时,你就开始为我们美丽的世界做出贡献了。QCN,已经把自己的源代码在GitHub上公开[5],有Windows和Mac两个版本,希望所有感兴趣的geek来献计献策。

其实,建造美丽的世界,又何尝不是一个众筹项目?确切地说,应该是一个参与者最多,跨越时间最长的众筹项目。我们每一人贡献一粒小小的“雪花”,便会创造出这个美轮美奂的世界。

(本期科技新闻与地震学有关,本人知识实在有限,无法给大家做科普了:)

[1]. Sarah Perez,  http://techcrunch.com/2014/08/29/tripcast-is-a-beautiful-travel-journal-for-iphone/ , Aug 2014.

[2]. University of California, Berkeley, http://seismo.berkeley.edu/research/early_warning.html , Aug 2014.

[3]. U.S. Geological Survey, U.S. Department of Interior, 70 percent odds for large earthquake by 2030, http://www.usgs.gov/newsroom/article.asp?ID=1216#.VANkSbywLfs , Oct 1999.

[4]. Stanford University, Quake-Catcher Network, http://qcn.stanford.edu/ .

[5]. GitHub.com, https://github.com/carlgt1/qcn .

图1. Link

图2. [1].

图3. [4].

(2个打分, 平均:3.00 / 5)

科技一周~简约以至无穷

科技一周~简约以至无穷

2014/08/24

平静的天空,精简已极,未曾缱绻,何来纷繁?上苍只设计了这简单的蓝色,无有丝毫之点缀,却不晓得凝固了多少作家的情节,多少画家的色彩,以及多少诗人的叹息?简约,是一种无穷的美,她藏在时空的箭矢里,可以临于前,可以至远方。若果有一日,你在蓝天下封起一笺白纸,那定然也是份简约的情书。

本周的新闻评论,便是集中在简约而美的设计上。

  • Google收购了一家叫做Gecko Design的工业设计公司[1],但没有透漏收购金额。我们也无从知晓,Gecko Design具体有多少员工,只知道在收购之后,Gecko Design会有5名员工(包括其总裁)被划归Google X Research Lab。这家公司成立于1996年,在设计领域提供多种服务,包括公司logo,品牌视觉形象,以及网站形象的设计。随着消费类电子越来越重视设计,Gecko Design也把自己的服务拓展至此。近些年,Gecko Design以简约的风格,主导设计了惠普的“One Laptop per Child”,Jawbone手环,以及Fitbit手环。我想,Google之所以收购Gecko Design,也是考虑到了自己在工业设计方面的不足。与竞争对手Apple成熟且领先的设计能力相比,Google在这方面才算刚刚起步。举例来说,虽然Google Glass是个不错的idea,但其设计却遭到媒体的嘲笑,被形容为“笨拙且不时尚”。此番收购,是继挖来时尚设计大师Ivy Ross之后,对底层设计人员的强有力补充。
  • 本周五,一款叫做,Sense,的睡眠监控器,在众筹平台Kickstarter上结束了一个月的募集期,有近两万人参与订购,总额度240万美元,远超其预期的10万美元[2]。Sense是由Hello公司开发,而Hello公司的创始人正是著名的“辍学生”企业家,James Proud。James,今年虽只22岁,但已有过两次成功的创业经历了。他在18岁的时候,决定辍学,并获得10万美元的“Theil Fellow”辍学奖。两年之后,James成为第一个卖出自己公司的“Theil Fellow”,当时,他把自己创办的音乐聚合网站Giglocator成功卖给Peter Shapiro公司。按下James的传奇不谈,下面,我们来重点看一下他这个化繁为简的产品:Sense。

 首先,从外观上来说,Sense的设计堪称简约中蕴含时尚,以云白色或碳黑色为主,搭配简单线条,给人一种细致透明的宁静感。这种宁静感,对于智能家居类的产品非常重要,唯有如此,方可在不经意间为人们提供无缝的智能服务。智能家居产品,尤其要尽量避免与人体的接触。我曾经用过一段时间的Jawbone手环,来监控自己的睡眠,但最终还是把它从手腕上取下,因为带上Jawbone之后,非但不能促进睡眠,更会对睡眠质量有反向的不良影响。而使用Sense,当然不会有上述问题,因为你几乎不会觉察到它的存在。

Sense系统分为三个部分:坐落在桌面上的室内监控球,别在枕头上的睡眠别针,以及一个iOS App。监控球设计成温馨的鸟巢形状,用以探测卧室内的环境光强、温度、湿度、以及空气中的悬浮颗粒浓度。睡眠别针的外观简单得与普通别针无异,但却内含一个非常灵敏的震动感应器,通过检测侧身、翻转等动作,来识别并分析人们的睡眠状态。一枚纽扣电池,就可以给睡眠别针提供一年的电力。最后,收集到的所有数据都被传送至App里,由软件进行分析,对人们的睡眠状况评分,并提出改进意见。值得一提的是,整套系统的配件并不是由工厂开发模具,制造出来,而是完全由3D打印机打印出来。的确,对于智能硬件类的初创企业而言,3D打印机是一个非常经济且有效的设备。我想,这很快就会成为智能硬件设计的趋势。
[1]. Zach Miners, http://www.pcworld.com/article/2598100/google-acquires-gecko-design-for-nextgeneration-products.html , Aug 2014.

[2]. kickstarter.com, https://www.kickstarter.com/projects/hello/sense-know-more-sleep-better , Aug 2014.

图1. [1].

图2. http://images.bidnessetc.com/img/82dbce7b4ff9f093aa7ff9c43ae70d8a-sense-a-new-sleep-tracker-from-22-year-old-thiel-fellow.jpg

图3. [2].

图4. [2].

(4个打分, 平均:4.00 / 5)

科技一周~我们生活的痕迹

科技一周~我们生活的痕迹

2014/08/17

每一秒钟的停顿,都记录了生活的痕迹,我用自己的记忆把这些瞬间刻录下来,存在脑海里。当回思的时候,有些旧日的情景重现出来,像是在夕阳里拾起的朝花,虽然已成过往,但犹可触及。然而,有些情景,却散如烟花,任我如何寻思,终无法获得。每当这时,我总是希望,倘若自己所有的过往都能被机器拍摄成图像,并存于网络,便再不会有此遗憾了。我终究会老,并失去记忆,如流萤一样死去,然,机器并不会死,网络是永恒的。

这一周的新闻与我们生活的图像有关。

  • 本周,Google收购了一家叫做Jetpac的图像应用公司[1]。Google并没有透露具体的收购金额,这更让人们认为,所谓的“acquire”只不过是硅谷里常用的客套词汇,而实质上是对人才的“acqui-hire”。Jetpac创立于2011年,目前约有10名员工,主要的产品是基于社交图片的旅行App。一开始,Jetpac是利用Facebook上的图片来做社交旅行,但在2012年,Facebook收购Instagram之后,Jetpac也把精力集中到Instagram上来,利用Instagram上的海量图片来做旅游推荐。Jetpac的CEO曾这样向TechCrunch描述自己的产品:“人们可以通过图片来可视化搜索自己要去的地方,这种方式与查看设施条件或阅读评论相比,显得更加自然”。值得一提的是,为Jetpac提供背后技术支持的公司,叫做Orbeus,这是一家由几个年轻中国人建立的初创企业,提供基于云计算的图像识别技术。
  • 来自伯克利大学计算机系的一篇论文,提供了一个分析你常态表情的算法[2]。简单说来,这个算法利用你的一系列图片,计算出你的“平均”表情,这个“平均”表情就是常态表情。这有什么用呢?举个假设的例子来,如果你超速,在路上被警察叫停,当警察看到你一脸愤怒的表情时,警察除了会给一张超速的罚单外,还会在上面加注说“你有威胁警察的表情”,那么你的罚款额度可能会比仅仅超速要高。现在好了,如果你本来就长了一个“愤怒”样,那么根本不用多交罚款。你可以用这套算法分析出自己的常态表情,拿到法官那里说:“I wasn’t making an angry face. That’s how I always look. See, I’ve an algorithm to prove it!”当然,这个算法不仅可以用在呈堂证供上,它其实还可以用在训练那些基于特征的目标识别器(object detector)上。这篇论文里宣称,经过该算法“平均”之后的图像,再输入给目标识别器,会加速识别器的训练过程,因为这些“平均”之后的图像拥有更加稳定的特征点。

既然谈的都是图像,那么本周的科普也是与图像相关:人脸识别。

人脸识别(face recognition)归属于目标识别(object recognition)技术,但在整个目标识别技术中,人脸识别技术被研究的最多最深,这大概是因为这项技术在现实社会里更有用吧,尤其对于社会安全来说,能够让计算机快速而准确的识别出罪犯,关乎到每一个公民的切身利益。当然,人脸识别中用到的许多算法也是可以扩展到其它识别里去的,所不同的只是如何建立模型(比如,房子和人脸有着不同的特征点;如果使用隐马尔可夫模型,那么内部的状态设定也是不同的)。

从应用上来说,人脸识别主要分为两类:1. 验证(face verification);2. 匹配(face matching)。人脸验证是个一对一的过程,也就是说,目标库里只有一个人脸,需要校验现在输入的人脸是否与目标脸一致。而人脸匹配则是个一对多的过程,目标库里或许有海量的图片,需要从其中找到与输入人脸一致的所有图片。

最初的人脸识别技术,主要集中于局部特征提取上,也就是说,通过把输入图像中人脸的特征点(鼻子、嘴、额头、眼睛)提取出来,形成特征向量,然后与库里的图像进行特征向量匹配,输出匹配度最高的人脸做为识别结果。这种方法效果并不好,于是又发展出了全局特征提取算法。最著名的要数,主成分分析(PCA,Principal Component Analysis)法。简单说来,这种算法是基于数学分析,计算出“更底层的人脸特征”,这些“更底层的特征”并非人们所能感受,只是在数学范畴内才有意义(例如,傅里叶分析里的系数),然而,这种“更底层的特征”却比人眼看到的表层特征,更能识别出准确的结果。

除了上述两种算法之外,还有一类识别算法是基于模型(model-based)。基于模型的算法是当前最流行的技术,无论从算法效率,还是识别度上来说,都比前两种要好。相关的模型有很多:Probabilistic Elastic Part Model,Hidden Markov Model,等等,有兴趣的同学可以参考综述[3].

 

[1]. David Murphy,  URL, Aug 2014.

[2]. Derrick Harris, https://gigaom.com/2014/08/15/new-algorithm-takes-the-average-of-photos-perhaps-proving-that-is-how-you-always-look/ , Aug 2014.

[3]. Rabia Jafri and Hamid R. Arabnia, A Survey of Face Recognition Techniques,  Journal of Information Processing Systems, Vol.5, No.2, pp.41-68, June 2009.

图1. http://www.tourism-review.com/temp/article_zoom_2284_2.jpg

图2. http://cdn1.tnwcdn.com/wp-content/blogs.dir/1/files/2012/11/face-520×362.jpg

(没有打分)

科技一周~Smart Shopping Mall and More…

科技一周~Smart Shopping Mall and More…

2014/08/10

这世上,倘若有个地方是女人之钟爱,那一定非Shopping Mall莫属。无论你是下里之凤姐,还是华贵之奶茶,总还是要找个地方去逛街购物,总还是要给你背后的男人一个打开钱包的机会。然而,现行的这种逛街体验存在了数十年,对于女人的消费刺激渐趋日衰之势。如何能改善体验并进一步刺激女人们的消费,则成了许多商店的新课题。于是,高科技公司的机会来了:打造Smart Shopping Mall,让女人的消费更迅捷更有效更庞大!让她们背后的男人永远刷爆!

  • 在打造新一代智能购物商场的方案里,类Apple iBeacon系统起着至关重要的作用。近日,商业地产集团,Simon Property Group,宣布将联合Mobiquity Technology公司,在自己旗下近200个购物中心里,架设Mobi-Beacon网络,以期为顾客打造新型的购物体验[1]。此次,Mobiquity所提供的Mobi-Beacon网络,基于BLE(Bluetooth Low Energy)技术,并且全兼容Apple 的iBeacon,可以使得iOS设备无缝接入Mobi-Beacon网络。Simon是美国最大的商业地产集团,旗下拥有约400个购物中心,其中最著名的要数遍布全美的Premium Outlets。Simon希望凭借Mobi-Beacon网络,为门店与顾客提供一个实时互动的消费体验,例如,基于顾客的位置信息,提供店内导航服务;基于顾客的消费历史,提供实时的打折点卡;更吸引人的是,顾客甚至不需要拿出信用卡,便可以完成对商品的购买。可以说,自从Apple在自己的门店内架设iBeacon以来,美国的购物中心纷纷效仿,一波“Smart Shopping Mall”的浪潮正在袭来,这自然是女人们最希望看到的。
  • iBeacon的核心技术是BLE,但BLE却不仅仅可以用在提升购物体验上,例如,现在越来越火的穿戴式设备里,便有相当一部分也采用了BLE技术。今天要介绍的穿戴式设备会令男士们相当的性奋。最近,英国成人用品零售商Bondara展示了一款新设备~性爱计数环,SexFit[2]。SexFit采集性爱数据,并通过BLE技术,与智能手机通讯,从而可以告诉用户,in-n-out的频率,消耗了多少热量,甚至可以把自己强大无比的性爱数据分享到Twitter和Facebook上。试想一下,当你发送了一条这样的微博:“人生不过深深浅浅,起起伏伏,幸运的是,我们的记录永不磨灭…恭喜你们,击败了世上99%的情侣!恩爱等级:当时一见已销魂~sent from SexFit”,你的朋友们会是何等的震惊!!

本周科普,谈一下关键的BLE技术,俗称“智能蓝牙”(Bluetooth Smart)。在谈论BLE之前,我想先说一件其它的事情:最近,诺基亚北京分部被裁撤,有中国某公司员工对诺基亚以及被裁的员工极尽嘲讽之能事。这其实并非是一种好的态度,殊不知,每一个公司都会有兴盛与衰落[3],我们不应当只看到一个公司的失败,还应当看到它曾经为人类历史做出的贡献。一个公司,倘若可以在自己的墓志上铭刻下许多推动世界进步的技术,那么在我眼里,这远比那些跟风发财的公司值得尊敬。

诺基亚正是这样一个值得我尊敬的公司。智能蓝牙技术便是由诺基亚在2006年研发出来(当时叫做Wibree),并于2010年成为一项蓝牙标准,现在已被几乎所有的智能手机支持。BLE的出现,使得移动支付在NFC技术之外,又多了一种选择,并且与NFC相比,BLE拥有很多优势。BLE采用2.4GHz的射频频率,这与传统蓝牙频段兼容,可以覆盖100米的通讯距离,而NFC则只能完成4厘米以内的通讯。这种技术上的差别,使得BLE非常适合用来进行室内导航,与门店实时交互,以及移动支付。与另外一项普及的通讯技术,Wi-Fi,相比,BLE的功耗低得惊人,只有0.01~0.5 watts,而Wi-Fi虽然通讯距离更远,但其功耗则是BLE的30倍以上。在移动设备受限于电池容量的前提下,用Wi-Fi来进行移动支付并不是一个明智的选择。

虽然,NFC技术在功耗和价格上更有优势(因为NFC技术是无源的),但BLE在通讯距离、安全性、交互性、以及易用性上来说则比NFC更优秀。所以,综合来说,BLE是现在备选的几个移动支付技术里,最有希望的一个。下面所附之图给出了BLE与NFC的详尽对比。

[1]. The Wall Street Journal, http://online.wsj.com/article/PR-CO-20140804-906174.html , Aug 2014.

[2]. Daniel Cooper, SexFit is a pedometer for your penis,  http://www.engadget.com/2014/08/07/bondara-sexfit-i-used-to-be-a-serious-journalist/ , Aug 2014.

[3]. 硅谷寒, 科技一周~没有梦幻的公司, http://www.valleytalk.org/2014/01/26/23253/ , Jan 2014.

图1. http://cdn1.appleinsider.com/ibeacon-131206.jpg

图2. [2]

图3. http://www.retailcustomerexperience.com/images/BLE-vs-NFC-infographic.png

(2个打分, 平均:5.00 / 5)

科技一周~The Age of AI

科技一周~The Age of AI

2014/08/02

下一个时代是什么?我想,那不会是最好的时代,也不是最坏的时代,只是个平凡的,历史早已注定的时代:人工智能。

2011年初春,午后阳光暂时偷走了硅谷里的料峭寒意,在山景城(Mountain View)的临街转角处,渐渐多起了行人,以及她们的低眉细语。我正坐在一间叫做Red Rock的咖啡馆里,却忽然看到一个机器人进来,径直走到前台,点了一块蛋糕。当咖啡师(Barista)故意询问它,“是在店内吃呢,还是带走?”,全屋子的人们都笑了出来。毫无疑问,机器人自然是要把蛋糕带回去给主人吃的。

这是一个令人轻松的场景,然而,其背后所蕴含的技术却并不轻松,其中涉及无线通信、实时视频的压缩与传输、自动控制,等一系列现代计算机技术。更进一步,如果,这个机器人能够完全自主行走,并自动问答,那么则需要图像识别、语音识别、自然语言处理、目标跟踪等一系列更有“深度”的技术来支撑。这些智能技术,在历史上也都曾陷入过停滞不前的境地,然而今天,随着底层硬件技术的成熟,它们又重新兴盛起来,再次成为科学家的研究热点。本周的新闻也正由此而来:

  • MIT媒体实验室的美女教授,Cynthia Breazeal,在众筹平台Indiegogo的项目,JIBO,在短短二十天里,就筹得近$140万资金,远远超过最初的$10万目标[1]。JIBO是世界上第一个家用机器人,它拥有呆萌肥圆的外型,像个小小多啦爱梦。目前,JIBO的主要功能是充当家庭的娱乐天使,提醒管家,和推荐助手,比如,在大家聚餐时,它可以担任摄像者;在小孩子睡觉前,它可以讲故事;当你今天有约会的时候,它可以提醒你;当你想吃饭的时候,它可以推荐你所喜欢的餐馆,并下单。JIBO的售价为$499,预计在2015年十二月推出。(我可以做个预测,JIBO迟早会成为Apple和Google竞逐的对象)
  • 如果说,JIBO是以卖萌带给人们欢乐,那么另一个有趣的机器人,hitchBot(搭车机器人)[2],则是以博同情来巧取人们的帮助。hitchBot像是一个其貌不扬、无家可归的孩子,站在公路旁边,伸出拇指,希望路过的人们可以开车载它一程。如果司机把它捡起来,放在车上,那么它会立刻与司机互动聊天,侃大山,讲笑话,当然也会告诉司机自己希望去的下一个地点。hitchBot是由加拿大的两名研究人员(David H. Smith and Frauke Zeller)设计的小机器人,他们希望hitchBot通过搭顺风车而独自走遍整个加拿大,目前这个小机器人已经行程近4000英里。

本周来聊一下在机器人设计中几乎必备的一项技术:目标跟踪(Object Tracking)。在上文中提到的两个机器人,都离不开这项技术,比如,JIBO通过内嵌的可以360度旋转的摄像头来捕捉并跟踪家庭成员的面容,然后根据脸部分析,拍下一张最好的全家福照片。那么JIBO是如何做到跟踪人脸呢?当然,第一步是要先识别出来人脸,关于识别的技术有待以后再讲。今天要讲的是识别出来之后的跟踪技术。

相对于识别技术,跟踪技术并不是在单一图像上实现的,而是利用了连续的多帧图像。可以说,如果图像识别是个二维技术,那么目标跟踪则是个三维(多了个时间上的维度)技术。当机器人在当前帧上识别出来某个物体后,那么它需要在下一帧里快速的“跟踪”上这个物体,并不需要重新分析整个下一帧图像(因为如果重新分析的话,那么速度就太慢了,达不到实时的效果)。在目标跟踪技术里,一个很关键的算法是运动估计(Motion Estimation),越快速地估计出下一帧里的运动方向,则可以越快速的跟踪上目标。

运动估计的算法有很多种,其本质上是一种搜索算法。在当前的硬件设计里,最常用的是基于块匹配的递归搜索算法:3D recursive search block matching[3]。这个算法是利用当前帧的运动向量值,在下一帧的几个备选向量里,搜索出来最匹配的像素块,从而确定下一帧的运动向量。这种算法在最初的几帧里,并不能找到真正的运动向量,但由于它的递归迭代性,当经过十几帧之后,估计的运动向量就会收敛到真正的向量值。通常,摄像头采集的频率在30~60Hz,也就是说,该算法可以在0.25秒~0.5秒的时间里跟踪上目标物体。这样的跟踪速度,基本上可以满足家庭的需要了。

 

[1]. JIBO, the world’s first family robot,  https://www.indiegogo.com/projects/jibo-the-world-s-first-family-robot , July 2014.

[2]. Brandon Griggs, Hitchhiking robot is halfway across Canada, http://www.cnn.com/2014/08/01/tech/social-media/hitchhiking-robot-hitchbot/, July 2014.

[3]. G. de Haan, P. W. A. C. Biezen, H. Huijgen, and O. A.Ojo, “True-motion estimation with 3-D recursive search block matching,” IEEE Trans. Circuits Syst. Video Tech., vol. 3, no. 5, pp. 368-379, Oct. 1993.

图2. [1].

图3. http://media2.s-nbcnews.com/j/newscms/2014_25/512356/140616-hitchbot-robot-1649_de262663d0cbc7ca1f7902450c8e9ee9.nbcnews-ux-760-800.jpg

(没有打分)

科技一周~那时未必花开,只有曾经的年少

科技一周~那时未必花开,只有曾经的年少

2014/07/27

小时候,我家附近有一些樱花树,听祖母说,是当年日本人栽的,曾经盛开过,整树整树都是白色的花瓣,但不知出于何种原因,自八十年代以来,这些樱花树便再也不曾绽放过。那时,我经常一个人偷跑出去,给樱花树浇水,梦想着某天之后,会有无数的樱花在我面前盛开。二十年过去了,我的梦想并没能变成现实,樱花树依然瘦骨嶙峋地立在原地,直到有天被市政厅的人将它们一一拔去。

如今我已长大,虽不再奔跑呼喊,却从未失去梦想,心中仍有一株“樱花”,正自生根发芽,静静地在那里,等着我来看它美丽的绽放。当然,偶有彩云飘过,我也会回想往事:那时未必花开,只有曾经的年少。

本周的科技新闻,等来的正是Amazon,这株没有盛开的“樱花树”:

  • 本周是科技巨头密集发布财报的一周,Facebook、Google、Apple都交出了靓丽的财报,唯有Amazon令人大失所望,不仅仅本季度财报未达预期,下季展望更是预亏4亿~8亿美元,随后,Amazon的股价重挫10%。相对于另外三个巨头赚得盆满钵满而言,Amazon算是个不折不扣的另类,它曾连续十数年亏损,但股价却一直上扬。之所以如此,大概是因为Bezos(Amazon CEO)的个人魅力所致。在此之前,媒体和投资人几乎都把Bezos看作一个Visionary Leader,甚至将其与乔布斯并列。Bezos所做的一切,包括建设物流网络、云服务中心、在线视频、布局各种生态系统,都无可辩驳,令投资人相信,即使现在亏钱,前景也必然美好。然而这一次,当看到Amazon“几乎”布局完毕,却依然亏损的时候,很多人失去了耐心,选择退出投资。虽不能说,Bezos之前的愿景都是“花言巧语”,但现在,的确到了需要Amazon把“樱花”秀出来看的时候了。
  • Amazon的财报不好,但它的竞争对手却不会有丝毫怜悯。Apple在本周五,以一千万到一千五百万美元的价格,把BookLamp买下[1]。BookLamp是一家基于大数据和机器学习技术,为读者提供书籍推荐/搜索的初创公司,约有10名员工,此前曾融资90万美元。Apple凭借BookLamp的技术,再结合自己的iBooks平台,势必会与Amazon的GoodReader进行一场惨烈的竞争。BookLamp的核心服务是通过机器学习算法来理解一本书的类型,并把与该书类似的书籍推荐给读者。例如,某读者看了《达芬奇密码》这部书,算法首先根据类型相关度的高低把《达芬奇密码》分解为“宗教信仰类”(18.6%)、“推理小说类”(9.4%)、“艺术类”(8.2%),“秘密社团类”(6.7%),然后算法会把“相关度向量”与《达芬奇密码》最相近的书籍推荐给读者。

本期科普将围绕着樱花树的“存活性”来聊一聊:)试想,倘若我在事先就知道那些樱花树早已死亡,根本不会开花,我便不会再浪费时间去浇灌它们。那么,我该如何去判断樱花树是否能盛开呢?我不是植物学家,自然无法判断,但我的目的是,把这一概念类比到机器学习里来。在机器学习理论里,有一个很重要的判断,就是“某一个待学习的概念是不是可学习的”?类比我的樱花树,就是“这一株待浇灌的樱花树是不是可存活的”?只有事先判定了概念的“可学习性”,我们再去设计相应的算法来学习它,才会有意义。

哈佛大学教授Leslie Valiant[2]给出了一种概率意义下的“可学习性”判断:PAC Learnability。简单说来:如果在某种算法下,某个待学习的“真实概念”与逼近它的“假设概念”可以在概率意义下达到误差为零,那么这个“真实概念”就是PAC可学习的。对照计算理论里的时间复杂度和空间复杂度,Leslie定义了机器学习算法中的样本复杂度,并给出了PAC可学习概念的样本量下限值。这个“样本复杂度”可以类比为,我浇灌樱花树的难度,简而言之,就是“我们需要多少样本才可以学习好一个概念”vs“我需要浇灌多少水才能看到樱花盛开”。其实,在前述BookLamp的新闻里,其推荐算法中要学习的“书籍类型”就是一个PAC可学习的概念,有兴趣的同学不妨参考[3]中Conjunction of Boolean Literals的例子。当然,真正实现起来,要比[3]里例子复杂一些。Leslie Valiant也凭此奠基性的理论,获得了2010年度的ACM图灵奖。

 

[1]. Josh Constine, Ingrid Lunden, http://techcrunch.com/2014/07/25/apple-booklamp/, July 2014.

[2]. http://amturing.acm.org/award_winners/valiant_2612174.cfm, 2010.

[3]. Mehryar Mohri, “Foundations of Machine Learning”, ISBN-13: 978-0262018258, The MIT Press, August 2012, pp. 18-19.

图1. http://timedotcom.files.wordpress.com/2014/07/amazon-q2-2014-earnings-report.jpg?w=1100

图2. [1].

(没有打分)

科技一周~可以测知的世界才更残酷

科技一周~可以测知的世界才更残酷

2014/07/19

自古至今,人们对能够预测未来,并通晓过去的神,都有着敬畏之感。那么,这世上究竟有没有这种神?又或者,现下大行其道的机器学习技术有没有可能成为这种“神”?要回答这个深奥的问题,首先需要弄清楚另一个更深奥的问题,即:世界,究竟是不是一个可以观测(Observable)并可以控制的(Controllable)系统?“可观测”和“可控制”是两个计算机术语,通俗地讲,可控制性,意味着我们可以通过现有的信息预测未来的一切;而可观测性,意味着我们可以通过现有的信息,探知过去所发生的一切。也就是说,如果世界满足上述两个特性,那么它一定会被我们预测并探知。

然而,我却想再问一个略显“人文”气的问题:当我们真地面对一个可以测知的世界,我们人类是会快乐,还是痛苦?或许对于某些人来说,是快乐的,因为他们是这个世界的“成功”人士,当世界被测知出来,他们会看到自己那穷奢极欲享受无边的未来;然而,对于绝大多数人来说,这种可以测知的世界却是相当的残酷,因为在未来,他们依然是普普通通的屌丝,劳苦终日。这个论断是基于“富则愈富,穷则更穷”的大概率假设。

本周的科技新闻,也是从预测未来开始:

  • 在上周日,随着世界杯的曲终人散,Google Cloud Platform的预测水平也盖棺定论[1]。对于淘汰赛阶段的16场比赛,Google预测对了其中的14场(错的两场是德国vs法国,荷兰vs巴西),这个结果虽不及百度的100%命中,但也算说得过去。除了Google、百度、微软这些科技公司外,世界最大的投行高盛,也给出了自己的预测。当然高盛的预测比较惨,错了四场[2]。随着大数据和机器学习技术的普及,各大公司都开始将该技术应用于对未来事件的预测,这已是一种成型的科技大趋势,渐渐地便会伸及我们生活的各个角落。
  • 接下来的新闻,是件令人伤心的事情。2014年,7月17日,马来西亚航空公司的MH17航班,在乌克兰与俄罗斯的边境处被导弹击中,全员遇难。在仅仅几个小时之后,美国总统奥巴马便发言称,MH17是被乌克兰叛军区域所发射的导弹击中。奥巴马的这一结论,是美国军方分析了卫星所捕捉到的各种信息后才得出的。能够如此迅速锁定导弹发射区域,可以说,现代计算机技术功不可没。与前述预测世界杯相反,这一次,计算机技术被用来探知过去已经发生的事件,即,恢复已发生事件的历史状态。当然,无论是对未来的预测,还是对过去的探知,现代科技技术都还远未成熟,其所得出的,并非是确定性结论,而是统计意义下的概率性结论。所以,世界是否可以测知,现在还并不能给出准确性的答案。

本期的科普,来聊一聊Google预测世界杯的机器学习算法。

对于任何一种机器学习算法,第一步都是要获取训练样本。Google获得的球员和比赛数据来自于一个专业的体育数据网站,Opta Sports。Google通过自己的Cloud Dataflow平台把来自于Opta Sports的原始数据进行预处理,再将预处理之后的数据导入Google Bigquery。第二步,Google Bigquery建立一个多层感知机(MLP,Multilayer Perceptron),通过样本进行学习训练。第三步,便是将下一场比赛的球员信息输入学习好的MLP,由MLP预测出比赛的结果。所谓的“预测”,其实就是一种“分类”,把输入的向量(参赛球员的数据)划分到两个类别里:胜、负。

这次预测世界杯的机器学习算法,是一种在线学习算法(Online Learning)。第四步,也就是最后一步,当该场比赛的结果出来,MLP立刻获知自己的预测是否准确,并根据结果进行自适应更新。之后,循环执行第三、四步,进行迭代,预测模型也将会在概率意义上越来越准确。

以上便是对世界杯预测算法的简介。当然,对于球迷而言,还是不要预测准为好,如果每场比赛都被预测准确,那么比赛就会变得索然无味,预先知道自己要失利的一方将会行尸走肉一样地踢完整场比赛。更甚者,这很有可能导致整个足球运动走向消亡。所以,倘若我们真地身处一个可以测知的世界,那么对于绝大多数人或事而言,就像是上了一列自动行驶的火车,纵然行驶的方向是万丈深渊,我们也无力改变。因为,这残酷,早已“天”注定。

[1]. http://googleblog.blogspot.com/2014/07/google-cloud-platform-predicts-world.html, July 2014.

[2]. http://www.goldmansachs.com/our-thinking/outlook/world-cup-sections/world-cup-prediction-model-update-6-26-2014.html, June 2014.

图1. [2].

图2. http://www.usatoday.com/story/news/nation-now/2014/07/18/malaysian-airlines-mh17-crash/12825433/

 

(2个打分, 平均:4.50 / 5)