The Mathematics of Romance (1):Preliminary

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享

几天前的Mozilla CEO一事沸沸扬扬。自2013年4月,经过近1年的苦苦寻找,Mozilla终于在3月25日公布了新CEO人选——JavaScript创建者、Mozilla当前CTO——Brendan Eich [1]。然而,10天之后(4月4日),新上任的CEO即因曾经(2008年)支持加州反同性恋婚姻提案、捐款1000美元,以及公开发表过歧视同性恋的言论,被迫离职[2]。

关于前文所列原因的真实性,作为怀疑论者的笔者始终存疑。不过,一些媒体截取了部分Twitter上的“民意”,展示出Eich的不受欢迎(可参考下图[3])。

不管怎样,另一个角度的报道更吸引笔者:“The Hypocrisy of Sam Yagan & OKCupid”(笔者试译:“假惺惺的SY和OKC”)[4]。

So, who is Sam Yagan? & what is OKCupid?

简单的说,Sam Yagan是OkCupid的联合创始人。OKCupid是一个很有名气的相亲网站。

Sam Yagan is an American Internet entrepreneur best known as the co-founder of OkCupid. In 2013, he was named to Time Magazine’s 100 Most Influential People in the World’s list. He is currently the CEO of the world’s largest e-dating site, Match.com.[5]

注:2011年2月2日报道,Match.com以50 million美金收购OkCupid。[6]

他们做了什么?

3月31日,用Mozilla登录OKCupid的用户会看到以下内容:

“Mozilla’s new CEO, Brendan Eich, is an opponent of equal rights for gay couples. We would therefore prefer that our users not use Mozilla software to access OkCupid.”[7]

他们在联合OKCupid用户抵制使用Mozilla,以表达对新任(2014年3月上任)CEO在2008年曾经给加州反同性恋婚姻提案捐款1000美金这一(系列)行为及其所代表立场的否定。

“假惺惺”一文认为:OkCupid played a major role in the successful effort to bring down Mozilla CEO Brendan Eich.(OKC在扳倒Brendan Eich中起到了决定性作用。)并质疑OKC此举的动机:PR,nothing but PR。(具体内容请参考原链接,作者用一个事实论据巧妙地佐证自己的观点。因与本系列文章主旨无关,不在此详述。)

By the way, OKC在4月2日撤销了上述行为。

笔者在此补充一项数据(除“说明”数据本身之外不做任何解读,读者可自行用于证明各自的立场)。下图是在Google Trends(googel.com/trends)检索“OKCupid”的结果。图中由A-I标注的点表示OKCupid(以下简称OKC)出现在某媒体头条。在A右侧的区域最小值对应2014年3月热度89,而4月份不完整数据已累积为100(曲线最右端上扬的最高点)。

笔者认为,数据分析从业人员的基本修养(之一),立场并非“必需品”,对“结论诞生过程”的“批判性审视”才是。在这种“朴素推理”产生的结果面前,最有效率的处理方式是保持沉默。(我)既不能提供“硬”数据以支持或反驳,也不能通过比嗓门的方式强迫别人接受(我的)观点。对事情的关注可以简单看看“投票结果”就可以了,即便“结果”也不足以说明“问题”(“少数服从多数”还是“真理往往掌握在少数人手中”?)。关于数据分析结果在其中扮演的角色(社会功能)是另外一个任重而道远的过程,还是让其他“更有话说”的人去说吧。

最后引用张有待(新浪微博@有待)老师在2013-2014深圳迷笛音乐节领奖(中国摇滚贡献奖)时讲的一句话:Time will tell。(他是个寡言的人。)

 

言归正传。这次的the Mathematics of Romance系列将会从OKC出发。

之前提到过一些,OKC is a free friendship, dating and social networking website,在07年被列为Time magazine十大相亲网站之一[8]。

OKC现在是IAC/InterActiveCorp旗下的网站之一(下面列出IAC所有的网站,为读者建立IAC逼格的baseline)。其创始人(Chris Coyne, Christian Rudder, Sam Yagan, and Max Krohn)在鼓捣出TheSpark(OKC的最初版本)的时候还是哈佛大学的学生。

 

文献来源:[9]

OKC除了提供一般的instant messages和emails等服务外,最有特色的是他们计算匹配度的方法。数据源有2个:users’ activities on the site and their answers to questions。通过回答问题,用户不仅给出了自己的答案,也暗示了他/她能够接受的选项范围,以及不同选项对他/她来说的重要程度。对于得分较高的用户,会收到一封邮件告知:他们是OKC最有吸引力的用户,可以在他们的匹配列表中看到更多的attractive people。最后,OKC还会写一句”And, no, we didn’t just send this email to everyone on OkCupid. Go ask an ugly friend and see”.

是不是逼格特别高[笔者很欢乐]。

2009年7月,OKTrends(Dating Research from OKCupid)上线。OKC网站自2004年发布累积了大量数据。OKTrends团队成员分析OKC用户产生的交互数据,在OKTrends(以下简称OKT)的博客上跟大家分享things they’ve learned about people,并且他们只发布那些他们认为有趣的内容。不幸的是,OKT的博客在2011年停止更新。

然而,有了这些博客,笔者得以研究和整理他们的做法(Please keep in mind that这些research是在2009-2011年进行的,与GFT在同一时期诞生)。了解他们是如何利用既有的数据(读者将会在后续文章中发现,同样是“大数据”,GFT与OKC的处理方式并不相同,后续文章将结合实例探讨细节上的差异)、如何根据特定的需求设计数据生成过程、如何在具体的应用情境下解读数据,等等。

我已经迫不及待的要向大家介绍:

1. 你的哪些特质影响你的吸引力(在社交网站上让其他人主动联系你)?

2. 人们在选择感兴趣对象时的博弈心理是怎样的?

3. 第一次向(感兴趣的)陌生人打招呼应该说些什么?

4. 第一次见面时可以聊哪些话题?

5. 以及OKT团队是如何得到这些结论的。

如果不与整个系列的文章冲突,笔者还将介绍另外一个数学博士利用OKC的数据给自己找对象的案例。让我们一起期待吧。

 

补充说明:

同GFT一样,OKT同样十分注重用户隐私,他们声明:

All data is anonymized and aggregated; no member of our blog staff sees an individual user’s personal information.

 

最后,以下是OkCupid’s Blog Team的成员名单,是笔者要由衷感谢的人(都是一些经历丰富、十分有趣的人,希望笔者有机会在后续文章中介绍他们):

Sam Yagan—CEO

Christian Rudder—editorial director / data analyst

Max Shron—data scientist

Chris Coyne—creative director

 

参考链接:

[1] Mozilla任命JavaScript发明人Brendan Eich为新任CEO. 张勇. 2014-03-25. CSDN. http://www.csdn.net/article/2014-03-25/2818955

[2] 唏嘘不已!Brendan Eich上任Mozilla CEO仅十天即因歧视同性恋被迫辞职. 钱曙光. 2014-04-04. CSDN. http://www.csdn.net/article/2014-04-04/2819159-mozilla-ceo-brendan-eich-resigns

[3] 同[2]

[4] THE HYPOCRISY OF SAM YAGAN & OKCUPID. 2014-04-06. http://uncrunched.com/2014/04/06/the-hypocrisy-of-sam-yagan-okcupid/

[5] Sam Yagan. Wikipedia. http://en.wikipedia.org/wiki/Sam_Yagan

[6] Christian Rudder. Wikepedia. http://en.wikipedia.org/wiki/Christian_Rudder

[7] OKCupid asks users to Boycott Firefox because of CEO’s gay rights stance, Russell Brandom, 2014-03-31, http://www.theverge.com/2014/3/31/5568136/okcupid-asks-users-to-boycott-firefox-because-of-ceos-gay-rights

[8] OkCupid. Wikipedia. http://en.wikipedia.org/wiki/OkCupid. Accessed at 2014-04-26.

[9] IAC/InterActiveCorp. Wikipedia. http://en.wikipedia.org/wiki/IAC/InterActiveCorp. Accessed at 2014-04-26

(没有打分)

(没有打分)

2013

[原文可参阅:作者:雨前 URL:http://www.china-cloud.com/yunhudong/guigudsy/2013/0806/20992_2.html

2013年,大数据、云计算驱动的技术和产业变革向纵深发展,行业创新、投资行为也更加频繁和务实,按照这些投资/融资金额和时间,这一期我们中云网主要针对千万美元以下投融资挑选了近30家典型企业和案例,基本都是云和大数据领域的创业企业,进行简单的整理和分析,以供参考。观察这些小额的投融资案例,主要还是涉及了大数据应用各个层面的,包括语音、情绪分析,广告、医疗、招聘、气象,甚至传统农业等方面,云计算企业也是主要针对企业的云端服务监控,数据管理,安全和服务优化,以及桌面云等服务范畴,To B 和面向具体服务和传统业务是绝对的主流,云/大数据跨界和对传统产业改造探索的力量正在积蓄。

一、云计算领域

1、企业云数据安全企业Ionic Security融资920万美元

4月19日,企业云数据安全及控制初创企业Ionic Security宣布获得了 925 万美元的 A 轮融资。Ionic Security通过加密的方式对包括电子邮件、Yammer 消息、照片、微博、状态更新等重要数据进行安全访问控制,为企业客户提供端到端的安全、身份及访问及访问控制平台,对企业的数据进行加密安全访问控制。此轮融资由凯鹏华盈领投。

2、BaaS初创企业FeedHenry获900万美元融资

5月2日,BaaS (后端即服务)提供商FeedHenry宣布已获得 900 万美元融资。FeedHenry移动应用平台以云计算为基础,与众多后端系统进行集成,可以为企业提供云存储、业务逻辑管理、安全、分析等功能,简化移动应用开发。FeedHenry 的平台支持原生应用与 HTML5 应用,所开发的应用可部署到公有或私有的 PaaS 及 IaaS 上。此轮投资由 Intel Capital 领投。原有投资者 Kernel Capital 、VMWare 等也有参与。

3、企业元数据内容管理初创企业M-Files获600万欧元融资

4月30日,企业元数据的内容管理解决方案提供商芬兰初创企业 M-Files 宣布获得 600 万欧元的 A 轮融资。M-Files 总部位于芬兰的坦普雷,现有的企业客户包括 AstraZeneca、SAS、Pandora、联合国、诺斯罗普?格鲁曼、嘉信理财、Hecla Mining 以及 Hill+Knowlton 等。M-Files 的解决方案是以元数据为基础的,这种内容管理办法并不关心文档 / 内容的存放位置,无论是放在本地还是云端或者混合均可,因为它是基于文档内容而进行信息管理的。此轮融资由 DFJ Esprit 领投。

4、B2B贸易云初创企业Nipendo获800万美元融资

3月13日,提供采购订单、发票等文档管理的软件即服务的 Nipendo 在 B 轮融资中获得了 800 万美元投资,投资方是李嘉诚旗下的 Horizon Ventures。Nipendo是一家提供从客户到供应商的 B2B 云服务的初创企业,成立于 2010 年。其服务可实现从询价、下订、发货到支付的全生命周期管理。平台支持各种主流 ERP 系统,兼容各种集成方法、数据格式及特定流程。

5、电商云软件提供商Brightpearl融资800万美元

5月22日,电商云软件提供商Brightpearl刚获得 8 百万美元的 B 轮融资,投资方正是先前提供 5 百万 A 轮融资的 Eden Ventures 和 Notion Capital。Brightpearl 为电商提供一系列的云软件服务,包括订单、库存及物流管理,记账服务、CRM 等等。它尤其注重多渠道销售配套的后台服务,这包括线上的多渠道,也包括和线上线下的信息整合。

6、专注企业移动数据优化管理Wandera获700万美元融资

4月10日,基于云的企业移动数据优化管理初创企业Wandera 宣布在 A 轮融资中获得由 Bessemer Venture Partners 投资的 700 万美元。Wandera专注于“移动数据优化”领域, 提供的SaaS 服务采取每用户按月收费的模式,在设备和互联网之间充当代理,提供数据连接的压缩服务,从而减少特定应用的带宽消耗,达到节省数据流量的目的。

7、“盒子里的 Amazon S3”,SwiftStack 融资 610 万美元

3月12日,为企业提供软件定义储存的创业企业 SwiftStack 获得 610 万美元 A 轮融资。通过 SwiftStack 提供的软件定义储存解决方案,客户企业可以从底层存储基础设施分离管理,在存储硬件上建立大量存储池,更加便捷地实行数据简化操作,达到降低整体运营成本的目的。通过 SwiftStack 提供的软件定义储存解决方案,应用开发人员及运营团队可以在私有数据中心内享受公共云的灵活性和可扩展性。

8、企业内部IaaS平台供应商Appcore融资600万美元

3月7日,基于企业内部部署的IaaS平台供应商Appcore宣布获得了600万美元的风险投资。天使投资人,还有Appcore公司第一批用户–爱荷华州的电信公司–引导了该轮投资。前期的投资人Telephone Acquisition Co.,对此亦有贡献。在该轮融资之后,Appcore公司的风投资金已经达到1100万美元。Appcore公司成立于2008年,公司总部位于爱荷华州的首府Des Moines。Appcore的主要业务有租用机架,软件交付,为电信公司提供基于云端的应用(提供off-site灾难恢复)。

9、“google保护者”Spanning获600万美元融资

3月22日,为使用google应用的用户提供数据恢复的保护公司Spanning宣布获得600万美元的融资,主要投资者是Foundry Group和一位神秘的“战略投资者”。Spanning为Google用户企业级的应用数据保护,Spanning几乎可以保护所有Google应用的数据,包括Gmail, Drive, Sites, 日历和联系人等等。用户只要在Spanning上用自己的Google账号注册,Spanning在获得许可后,就可以把这个Google账号使用的应用数据备份到云端,让使用者数据受到损害时及时进行恢复。

10、虚拟化管理软件公司PHD Virtual获400万美元融资

3月8日,虚拟化管理软件公司PHD Virtual宣布刚刚融资400万美元。PHD Virtual是专门为物理、虚拟及云环境提供VMware和Citrix备份以及监控解决方案的软件公司。其开箱即用式的备份套件可以充当一台虚拟设备,允许用户直接通过vSphere或XenServer管理程序直接备份,无需物理服务器或额外软件,从而降低虚拟环境的管理难度。这笔资金中的一半由其业务及技术合作伙伴Citrix以及VC机构Insight Venture Partners投资,其余200万美元则来自从Wellington Financial的债务融资。

阅读全文»

(没有打分)

Generic Cialis

(没有打分)

(没有打分)

百度:土豪投机移动互联

面对移动互联,百度急了。
这两年,百度股价最高时将近170美元,最低时为82美元,将近跌出了一半。百度的股价历经震荡,呈现V字型,目前恢复在150美元左右。
对于这种V字型的股票价格,有评论认为与IT大环境有关,也有认为是与360竞争密不可分,更有评论认为是百度移动战略裹足不前、行动迟缓的后果。
不管如何,百度正处在移动互联的生死关头。这一次,它重金投入移动互联,这究竟是投机还是重生,李彦宏和李明远能否带领百度成功转向移动互联?

1.投入:不缺钱

百度:土豪投机移动互联

百度有困难了。
传统业务增长缓慢,360新入市场者搅局。在腹部受敌的同时,百度和所有的互联网公司一样,正在抢夺移动互联“入口”,竞争异常惨烈。谁都知道,占领移动互联网意味着占领下一个市场。
在这场抢夺战中,百度表现并不坏,但也不好。有数据说,百度在移动搜索市场上所占份额仅为37.5%,远低于桌面搜索市场上的约80%。尽管这个数据存疑,但百度移动搜索市场份额不高是不争的事实。
从数据看危机。去年百度全年营收223亿元,比2011年增长53.8%,去年第四季度利润环比下降7%。而在今年第一季度,百度营收同比增长40%,运营利润率同比下降至37%,其中研发支出增长83%,居高不下。第二季度,百度总营收同比增长38.6%;净利润为人民币26.44亿元,同比下滑4.5%。唯一的好消息是,第二季度,来自移动互联的营收超过10%。
这家只有13岁的企业,提前进入“中年期”:一边是稳定传统业务,保持业绩不下滑,让资本市场好看;另一方面又要增加投入,全力以赴“拿下”移动互联市场。
“何止是百度,在全世界范围看,互联网公司对移动互联都没有很好的应对措施。”互联网资深从业者谢文说,从营收看,谷歌、Facebook和推特来自移动互联的比例大概在20%多,有的甚至占30%,并且增长快。这些营收大多来自广告业务。
尽管在今年第二季度,移动互联的营收数字是10%是一个好消息。这些利润来自何方,移动端的用户贡献率等具体数值,百度并没有披露。在当时的分析师会议中,百度掌门人李彦宏说:“移动端收入情况,等我们取得新进展的时候会公布,但不会按时发布。”
之前,在多个场合,百度高管曾经表示,百度正在逐步增大投资,投向基础设施和研发方面,尤其是在移动互联方面。比如在2011年12月,百度技术副总裁王劲向媒体透露说:“百度有10%的营收实验新业务,而对百度易平台研发的投入远远超过10%。”这个“易平台”是百度首次公开对外宣布的“移动互联”战略。又比如在今年2月的分析师大会中,百度再次声明,将“重点投资移动搜索以及建设移动生态系统”。李彦宏并不认为,由于过多的投资在移动互联方面而会减少利润。
外界评论不一。在最新一期的彭博社商业周刊中,根据24位分析师预测,今年百度的利润将大幅降少。“可以理解,在股价大幅上涨后,人们不禁要问,百度如何才能将近期的投资和收购转化为利润?”该报道认为,百度移动互联方面的战略,如收购了91助手、入股糯米团等大笔投资,会对利润率构成压力。“一些数据已经显示,百度的搜索市场份额已出现下降,而奇虎的份额有所上升。”
如果只从资金的角度看,百度以“不缺钱”的方式推广移动互联战略。内部一位基层员工A说:“我们百度有的是钱,只要能将KPI完成好。比起其他审批来说,移动战略的推广费用轻易申请到。”虽然是一句略微夸张的话,也可见百度对移动互联的重视程度。据悉,百度移动·云事业部大概有上千人。
百度对移动互联发狠。
另外,如果从投资的角度看,为什么百度的市值会呈现V字型,这与移动互联有多大关系?谢文认为,很大程度上与奇虎360搅局有关。“一开始,资本市场看到360在搜索市场对百度的冲击,一致会调低预期。当看到360的实力有限,作用有限,会慢慢恢复对百度的信心。”
这种观点在另外一个投资人那里得到了验证。这位B先生认为:“从技术看,搜索技术非常成熟。用户使用这两家任何一家的搜索,从大的方面看不出来有什么不同。非要让用户选择的话,也就是使用习惯。360擅长基于客户端的推广,一下能占据10~15%的市场。而百度可以迅速调整战略,将市值拉回来。”
B先生认为,桌面搜索“打架”已经没有任何意义,除非“某一家在底层技术上有重大突破,否则市场不可能有大的变化。而在移动互联时代,还要看双方的表现。”
移动互联的竞争刚刚开始。

 配图:百度近一年的股票价格走势

2.战略:看不懂

说起百度的移动互联战略,谢文仍旧是保持严厉的批评态度:“在我看来,这些都不叫战略,顶多称之为战术。”
2011年12月,王劲首次公布百度战略,并将其分为三步:“第一步是百度·易平台,把百度的移动软件打包整合放到手机上;第二步的核心就是要做云生态系统;第三步就是百度云操作系统。”
2012年百度世界大会中,百度云重点推荐“七种武器”,包括百度个人云存储、LBS·云、百度移动云测试中心、百度应用引擎,以及多屏幕Screen X技术、百度移动云应用生成服务和百度移动浏览内核。王劲再次解释推出“百度云三重奏”概念:“第一重”即铺设云基础设施,“第二重”打造新型应用平台,“第三重”共建商业模式。
而在2013年,年轻有为的李明远成为百度副总裁,全面负责移动·云事业部。在诸多的大会中,李明远重点推轻应用,认为解决了“用户在哪里,如何懂得用户的关系;并且有四大优点,第一是无需下载,即搜即用;第二破壳检索,智能分发;第三功能非常大,开发者和用户可以获得全能的体验;第四订阅推送,沉淀用户。”

阅读全文»

(3个打分, 平均:5.00 / 5)

淘宝技术嘉年华: 分布式系统稳定性模式的探索

(1个打分, 平均:5.00 / 5)

一个前即刻老兵的告白–我所了解的人民搜索的研发状况

一个前即刻老兵的告白

离开即刻已经几个月了,想起在jike将近三年的工作时光,感慨还是很多的,闲来无事,整理下在即刻的点点滴滴,以供同行或者后续想去即刻谋生的参考。

即刻的前身叫人民搜索,当时可以说一穷二白,当时的领导是宫,由于对搜索不了解,无从下手,就先和中科院进行合作,用开源的Lucene搭了个搜索,功能和性能不能适合大搜索的要求。后来就搁浅了。

然后来了世界冠军,世界冠军果然不同凡响,首先就和前中国谷歌总监刘的公司云壤合作,聘请刘作为首席科学家,云壤提供技术支持和开发,当时签的合同是给云壤一定的股权,同时还有一大笔钱,当然钱来自纳税人,也无所谓了,刘的公司经过不到一年的开发,在2011年6月20日上线,并且更名为即刻搜索,记得我们当时听到更名为jike,都乐了,怎么能叫“饥渴”呢。当时的云壤由于资金不多,所有的机器都是即刻的,但是由于即刻一直没有给清合同规定的钱,云壤将代码封装成黑盒子,以lib库的形式提供给即刻,我们工程师就天天哭呵呵的围绕着这些黑盒子工作。由于云壤利用了即刻的机器,即刻也有部分云壤的代码,二者就心照不宣,因为除了刘,真正的即刻领导们包括后来加盟即刻成为副总的另一个谷歌的王,其实也不懂搜索。就这样维持着。

即刻搜索核心技术是想从云壤获得,所以不停地给云壤钱,给一点,云壤就多给一点代码,我们内部开发人员天天苦哈哈的做些外围工作,因为真正的核心组件都是密文形式的lib库。有一阵子,由于即刻答应给云壤的股份一直不能落实,云壤一度要挟要上法庭关掉即刻的服务,所以即刻只好多给些钱,暂时缓和。后来即刻内部斗争爆发,事情真相浮现出来,这就是著名的20亿。虽然给了云壤很多钱,但是即刻搜索迄今尚未完全掌握核心技术,相关技术仍未向即刻搜索全面开放,因为即刻答应给云壤的股份始终没法落实。索引检索排序的核心代码还在云壤手里,即刻只能以黑盒子的形式使用。所以和云壤的合作以云壤的刘出局告一段落后,即刻拿到一堆估计永远没人去看和消化的用来充数的外围代码。从即刻的代码库中,根本看不到即刻搜索内部是怎么工作的,只是一个黑盒。
阅读全文»

(13个打分, 平均:4.69 / 5)

工信部 。 《移动互联网白皮书》。2013

(没有打分)

思科 。 《Internet Protocol Journal》 。 2011 Sept

(1个打分, 平均:3.00 / 5)