易动商务 --> 杂志 --> 互联网周刊 --> 商业

本站导读

很多人都听说过大名鼎鼎的PageRank算法,它能够自动判断网页的重要性,也是决定搜索结果排序的关键因素之一。但在很多时候,仅仅凭重要性远远无法完成一项排序。计算机和我们都有很多东西需要学习。

·学会排序

日常生活中存在多种多样的排序。我们最熟悉的,比如娱乐圈里的“超女”、“快男”,体育界的各项赛事,在学校里经常会碰到的成绩排名等等。

互联网周刊 | 本刊记者 陈琼 | 2008年01月20日 第 2 期刊载
2008年03月04日 星期二 本站发布

 

    很多人都听说过大名鼎鼎的PageRank算法,它能够自动判断网页的重要性,也是决定搜索结果排序的关键因素之一。但在很多时候,仅仅凭重要性远远无法完成一项排序。计算机和我们都有很多东西需要学习。

日常生活中存在多种多样的排序。我们最熟悉的,比如娱乐圈里的“超女”、“快男”,体育界的各项赛事,在学校里经常会碰到的成绩排名等等。而在计算机领域内,一个最典型和最热门的例子,恐怕就是排序在搜索引擎中的应用了。赫赫有名的PageRank算法,就构建了一套巧妙的机制和排序模型,来自动判断网页的重要性,并也成为Google的搜索引擎赖以成名的利器之一。

也恰恰是由于人们逐渐意识到排序问题至于搜索引擎效率的重要性,所以最近几年,整个学术界对排序的认识也在迅速提升高度,大家都希望可以非常正规的把排序当做一个学术问题来进行研究,并最终形成一个完整的理论体系。可以说,排序已经成为了机器学习领域内一个最新的分支。

就像该领域内的分类、回归、聚类等其他一些已经被研究得很透彻的问题一样,排序到底应该如何界定?存在什么样的特性?有什么理论的知识蕴含其中?如何通过机器学习来自动的构建出排序模型?

微软亚洲研究院(MSRA)大概在三年前开始了有关“排序学习”(LearningtoRank)的研究。2007年,MSRA一篇名为《Learningto Rank: From Pairwise Approachto Listwise Approach》发表,在整个学术界引起了强烈反响。据专门负责此课题的主任研究员李航博士介绍,这也和信息爆炸时代有一定的关系,用户面前的信息量太大,“很多东西都会希望有一个排个序,搜索是最典型的例子,以此来帮助他们去访问到最想要的信息。”

123下一页尾页

阅读小技巧:可以键盘左(<-)、右(->)方向键翻页