Netflix推荐算法

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享

前一阵子听闻阿里巴巴搞了一个推荐算法大赛,顿时想起Netflix搞过的Nexflix Prize. 大赛始于06年,Netflix希望通过比赛来找到合适的算法,以提高其推荐系统Cinematch的准确率,并承诺给使其准确率(以RMSE作为评测标准)提高10%的个人或团队一百万刀的奖励。最终,融合了多个参赛队伍的混血团队BellKor’s Pragmatic Chaos因为提交时间原因险胜The Ensemble团队,成功提高了10.06%的准确率,在09年拿下该大奖。由于用户及FTC等机构对于隐私问题的忧虑,第二届大赛还没开始就被取消了。在中国,估计应该不会因为这个原因停赛吧?下面就贴出当时获奖团队发表的论文。

Yehuda Koren,The BellKor Solution to the Netflix Grand Prize

A. Töscher, M. Jahrer, R. Bell,The BigChaos Solution to the Net ix Grand Prize

M. Piotte, M. Chabbert,The Pragmatic Theory solution to the Netflix Grand Prize 

(没有打分)

这份来自谷歌的新的研究论文详细阐述了如何训练神经网络在无人为干预的情况下读取数以百万计的门牌号。与以往不同的是,这项技术能像人一样,一整串的识别门牌号,而不是将其拆分成单独的数字来识别。谷歌方面表示,目前已用该系统识别一亿个街道号。这项技术的价值就在于,在用户使用谷歌地图时,为用户提供准确的位置信息,特别是在建筑编号非线性的地区。这份来自谷歌的新的研究论文详细阐述了如何训练神经网络在无人为干预的情况下读取数以百万计的门牌号。与以往不同的是,这项技术能像人一样,一整串的识别门牌号,而不是将其拆分成单独的数字来识别。谷歌方面表示,目前已用该系统识别一亿个街道号。这项技术的价值就在于,在用户使用谷歌地图时,为用户提供准确的位置信息,特别是在建筑编号非线性的地区。

electronic cigarette china

(没有打分)

Latent Dirichlet AllocationLDA

在自然语言处理领域,LDA是一种用来识别文档集或语料库中潜藏主题信息的生成模型。这篇引用次数近两

千次的论文由David Blei,Andrew Ng,Michael Jordan在2003年共同发表,论文中首次提出了LDA的概

念。光听作者的名字就是满满的营养啊,三位作者都是机器学习领域如雷贯耳的大牛。为了便于理解,贴一

个博客关于LDA的分析:http://www.xperseverance.net/blogs/2012/03/17/

(没有打分)

加州理工 。 《机器学习与数据挖掘》

(没有打分)

Stanford Mining of Massive Datasets

(2个打分, 平均:5.00 / 5)

微软“人才·创新·影响力”媒体沟通会视频

(3个打分, 平均:2.33 / 5)

Microsoft 。《机器学习领域的数学基础》

(7个打分, 平均:4.71 / 5)

搜素排序的机器学习:From RankNet to LambdaRank to LambdaMART: An Overview

(没有打分)

Google的新闻搜索算法专利:SYSTEMS AND METHODS FOR IMPROVING THE RANKING OF NEWS ARTICLES

(1个打分, 平均:5.00 / 5)

Challenges and Opportunities with Big Data

(没有打分)