The Mathematics of Romance (2):Same you, while attractive to more

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




The Mathematics of Romance (2):Same you, while attractive to more

副标题:头像那些事儿

废话不多说:这是个看脸的社会。

社交网站(屌丝级的新浪微博,或意识形态上高攀不起的Facebook or Twitter),求职网站(这个……),还有相亲网站……好像很难想到一个不需要上传头像(或personal profile)的网络服务。而彩笔都很难记清,从什么时候开始,人类(或具体地说祖国人民)进入网络时代,男女老少逐渐都有了自己难以割舍的网络服务。

对任何(正常)人来说,无论什么情境下的头像,都是一个展示自己的渠道。展示自己长得好看,展示自己逼格很高,展示自己的人生理想,展示自己的三观。

展示的目的是吸引。不知道“正常”的人们都怎么看,“吸引”在彩笔看来是个很暧昧的词儿。当“相互吸引”关系确立时,后面的事情就不好说了。但无论如何都是很有趣的事情,你值得拥有哦。

插注:前面一段话实质上与本文、大数据关系不大,但因彩笔坚信“文以言志”,而彩笔的是传递价值观,所以这些内容也不是完全没有必要。

 

本文关于头像选择,更具体的说,是相亲网站用户的头像选择(不负责任一点地说,社交网站也是类似的逻辑吧)——因为原始数据来自相亲网站的用户(看过preliminary的读者应该知道了)。

我想,所有人都会不同程度的同意下面这句话:

No matter how much time you spend polishing your profile, honing your IM banter, and perfecting your message introductions, IT’S YOUR PICTURE THAT MATTERS MOST.

 

一、谁敢说自己“不看脸”

这就是一个看脸的社会,don’t deny it。(我又没说只看脸)

1. 对异性的评价与挑选目标

旁白:题目中的评价挑选并不矛盾。假设所有人都给章子怡5分(满分5分)(此之谓评价),但并非所有人在挑选去民政局登记的对象的时候,均是以子怡为首选(此之谓定制目标)。弱水三千,只取一瓢饮,这里无需多言吧。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

两张图中的虚线表示的是各个性别群体对异性的评价分布(数据来源及操作方法将在文章结尾处尽表)。粗实线表示的是他们/她们向异性发送消息的比例分布。

从图中可以看出,男性对女性的(整体)评价(左图虚线)接近对称,但是在挑选“目标”的时候他们的倾向性非常明显(还需要彩笔明说嘛[捂嘴笑])。女性对男性的评价分布(右图)用“苛刻”来形容毫不为过。大多数(80%)男性在她们看来是worse-looking than medium,然而在选择发送信息的对象时,她们又变得宽容。

产生这种差异的原因值得玩味,但不在此处细表。图中的数据似乎是在告诉我们:不管长成什么样(异性对“你”的评价如何)都会收到信息(在这篇文章中,彩笔不想纠结群体与个体的关系——群体有并不代表群体中的每个个体都有)。而在本文中,我们用到的信息是:对于女孩子,头像中的你长得越漂亮,收到的信息就越多;男性的话,好难讲,彩笔一直觉得女性从男性那里寻求的并非“美颜”,所以才会出现上图中的神奇分布,但至少头像中的形象能让女性找到她们寻求的某样东西或某种感觉。

 

2. 数量化ATTRACTIVENESS

之前说到,头像在异性们心目中的好看程度与最终收到的信息数量是有关系的,并且按照“常理”,越好看的人收到的信息数量就越多(姑且忽略男女两性在对对方评价以及最终挑选目标时的差异)。

 

 

 

 

 

 

 

 

 

 

 

图中的信息呼之欲出:长相(头像)越好看的人,收到的信息越多(注意:纵坐标是“倍数”,而非绝对数量哦)。Female recipients的曲线斜率的增加速度快过male recipients——原来我们的小伙子们都是行动派嘛。

对于任何一个读到这里的读者,在此刻可以确认头像的重要性了吧。

 

3. 成功率与头像(长相)

前面讲的都是作为一个被动的receiver,头像与接收到的求*信息数量的关系。这一节中,展示的是作为sender,信息被回复(即“求*初步成功”)与头像的关系。长得好看的人收到的信息越多,那么发出的求*信息的成功率(被回复)是否也越高呢?请看下图。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

根据图表中的信息,说“越好看的人发出去的信息成功率越高”好像可以,但也好像有点牵强。Most attractive male senders在least attractive female recipients会遇到点挫折呢。不过还好,总的来说,也是“越好看,成功率就越高”的啦(如下图)。然后姑娘的成功率弱弱的高于小伙子们(果然,在社会大家庭中,蓝孩纸还是很照顾铝孩纸的)。

 

 

 

 

 

 

 

 

 

 

 

 

二、选头像时的does and don’ts

人就长成这无法被拯救的样子了,但是头像还是可以挽回一些的。能挽回多少?就看你怎么玩儿了~

1. FACIAL ATTITUDE

头像中的表情与每月新增联系人的数量关系如下。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

从图中可以看出,对于女生来说,笑比不笑的效果(吸引力)好,但是效果最好的头像表情是flirty-face。但要注意flirty face要对着镜头,如果没对镜头的话,可能会是相反的作用。男生的情况相对简单了:look away from the camera and don’t smile。

 

2. The MySpace Angle is busted.

The universally-maligned MySpace angle is achieved by holding your camera above your head and being just so darn coy.——我大中华的仰拍什么的,原来在异国他乡是有名字的啊!

 

 

 

 

 

 

这种自拍类照片往往是头像界所不齿的类型,然而,它在吸引新联系人(女性吸引男性)方面有着意料之外的正面效果,如下图。

 

 

 

 

 

 

 

 

 

 

 

 

这让研究人员百思不得其解,the Myspace shot对于女性来说几乎是唯一一种有效的照片类型。研究人员怀疑过,是否是因为这样的角度能够获得从上往下看女生上衣的角度(这么说十分隐晦,不过……应该能懂吧)。但当研究者将所有“能看到”的照片剔除,重复分析,得到的结果是一样的。甚至,the Myspace shot的效果还要好于直接“露”,嗯。

 

3. Guys should keep their shirts on.

同样与人类常识相反的是“男生秀腹肌”。在人们的印象中,Ab shot通常让人觉得PO主很二。然而实际的情况是这样的:

 

 

 

 

 

 

 

 

 

 

 

研究人员认为产生这种现象的原因是:Normally,将此类照片作为头像的人都有show off的资本,and naturally the best bodies get lots of messages。但是,如果是这个原因让这类照片火了的话,这个举措就不适合推荐给所有男士了哦。

 

4. Make sure your face is showing(?)

OkCupid过去是将露脸作为推荐项(强制项)出现在用户提交personal profile的页面的,然而in fact, not showing your face can be a positive, as long as you substitute in something unusual, sexy, or mysterious enough to make people want to talk to you.成功的例子如下:

 

 

 

 

 

 

 

 

 

 

 

这些用户收到的信息数远高于一般水平,但他们并没有很出众的个人介绍,正是他们的头像帮助他们达成了这样的效果。

写到这里,好像又与初衷矛盾了——不是说,这是个看脸的社会么?我想这个问题大家随意思考一下就可以了,无需彩笔给出一个答案(或答案之一)。而且我在最开始的时候就说过了:我又没说“只”看脸。

 

数据来源与操作方法

The data set was chosen at random from all users in big cities, with only one profile photograph, between the ages of 18 and 32. We then lopped the most and least attractive members of the pool, fearing that they would skew our results. So all the data in this post is for “average-looking people.”

 

We finalized our data pool at 7,140 users. Aside from running each picture through a variety of analysis scripts, we tagged, by hand, each picture for various contextual indicators. We double-checked the tags before generating our data.

 

To quantify “profile success” for women, we used new messages received per active month on the site.

 

We had to do something different than this for guys, because of the fundamentally different role they play in the online courtship process: they are the ones reaching out to new people; women send only a small fraction of the unsolicited “hellos” that men do. As you’ve seen, the metric we settled on is, “women met per attempt”, which is:

(new incoming messages + replies to outgoing first contacts) / outgoing first contacts

 

Basically, this is how many women a guy has a conversation with, per new woman he reaches out to, and we feel it’s the best way to measure his success per unit time on OkCupid. Note that if a guy has a particularly compelling photo, this ratio could exceed 1, as he’d be getting messages from the women who come across his profile, as well as the women he himself is reaching out to.

 

总结

多么有意思的结论。而且,是这么多有意思的结论。

不曾跟进过笔者其他文章的读者是否压根看不到这里:这跟大数据有半毛钱关系?!

其实此时此刻的彩笔根本压抑不住内心的狂热,想要大声告诉任何人:在有“大数据”(好吧,彩笔必须承认,这里的大数据定义有些模糊)之前,这些事情是无法做到的。——虽然其实不是,或者彩笔也不能确定的知道是或者不是。

 

在系列“GFT你这么diao,你的伪粉丝们造吗”最后一篇文章的结尾,笔者提出,GFT内生的一个drawback是:GFT自身是大数据的一套方法体系,然而它却是为预测一个由传统的统计方法得到的数据而存在的。在这种交错中,没有人知道伴生着什么问题(影响预测的准确性,或者对“准确性”的解读)。

在Lazer的文章[1]中也给出建议:Google可以通过combine big data and small data来优化预测过程。笔者认为,OKCUPID的这群研究人员做到了,或者说做了很好的尝试。

这个研究团队的主要成员已经在本系列的第一篇文章(约2个月前[惭愧])中有过简单介绍。

关于头像,他们在证明头像中人物的“质量”与收到陌生人信息的数量之间的相关关系甚至数量关系的基础上[参考文章6],还总结了拍摄照片的技巧[参考文章4](当然是以吸引力为衡量标准)以及头像内容与吸引力[参考文章3](收到陌生人信息数量)的关系,另外还从男性心理的角度出发,指导女性选择头像[参考文章2]。作为成果之一,他们还一度提供一项帮你判断哪张照片更适合作为头像的服务[参考文章5]。

作为一个基于online dating网站的研究团队,他们的兴趣内容还涉及发给对方的第一句话怎么说更容易收到回复?第一次约会怎样操作更容易lead to下一次?等等。

按照国内学术圈的惯用标准,既有科学意义,又有实践意义,“业界良心”好好嘛!

 

另注:

这真的是一篇关于大数据的文章(很难理解么)。之前的系列“the Big Data Concerns You HOW”出街之后,相信仍然会有不死心人士。本文提到的这类“工作”的门槛低,成就高(我就随口说说而已,哪有这么容易的事),不失为一个很好的切入角度。

这真的是一篇关于大数据的文章,所以我没有任何念头教读者如何选头像。将原科研人员的数据来源以及预处理过程交代清楚,其目的除了将原作拖下神坛,方便更多的不死心人士踩踏入门之外。另外一个目的也是告诉读者,这虽然是一个“大数据案例”,但也有其内源性的适用对象。虽然,作为参考而借鉴是没什么的。

——在这里也要深刻反思对“大数据”的界定模糊。

 

相关文献:

[1] Lazer D, Kennedy R, King G, et al. The Parable of Google Flu: Traps in Big Data Analysis[J]. Science, 2014, 343(6176): 1203-1205.

[2] The Mathematics of Beauty, 2011.01.10, Christian Rudder:http://blog.okcupid.com/index.php/the-mathematics-of-beauty/

微信公众账号《数据分析》的一篇文章基本算是原文的译文,但是没有标注任何引用,着实可耻:

大数据分析看如何成为美人。[八卦]2014.04.18:mp.weixin.qq.com/s?__biz=MjM5MjAxMDM4MA==&mid=200226343&idx=1&sn=714db607d786fab9504080fc4617815c#rd

[3] The 4 Big Myths of Profile Pictures, 2010.01.20, Christian Rudder, http://blog.okcupid.com/index.php/the-4-big-myths-of-profile-pictures/

[4] Don’t Be Ugly by Accident, 2010.08.10, Christian Rudder, http://blog.okcupid.com/index.php/dont-be-ugly-by-accident/

[5] What Is Your Best Profile Picture, 2010.05.06, Christian Rudder, http://blog.okcupid.com/index.php/my-best-face/

[6] Your Looks and Your Inbox, 2009.11.17, Christian Rudder, http://blog.okcupid.com/index.php/your-looks-and-online-dating/

(1个打分, 平均:5.00 / 5)

雁过留声

Comments are closed.