排名算法性能优化研究

21 0
2020-6-30 16:28:15
显示全部楼层

马上注册,结交更多SEO好友,可查看高清图片。

您需要 登录 才可以下载或查看,没有帐号?加入SEO研究中心

x
无论在现实生活中,还是在虚拟网络上,当用户需要从大量候选对象中找出那些价值比较大的对象时,如果依靠人工一一查看、分析、识别,工作量会非常巨大,这就需要借助算法对这些对象进行排名,这样即可在很短的时间内将那些比较有价值的对象返回给用户。例如,Web搜索列表排名、热点人员发现排名等。根据排名对象的不同,可将目前的排名算法分为关于一般对象的排名算法和关于人员对象的排名算法两类。另外,按照排名方式的不同,每种对象排名算法又可进一步分为两类:直接排名算法和融合排名算法。直接排名算法通过对数据对象进行直接访问和计算,最终得到一个排名结果。融合排名算法通过将多个排名列表融合为一个综合列表进行排名,得到一个最终排名结果。虽然关于不同对象的排名研究引起了研究者的广泛关注,但在不同应用场景下,仍存在一定的研究空间,本文针对如下问题展开研究:针对一般对象:直接搜索应用中的直接排名算法因没有有效利用图上的某些结构特征,影响了算法的排名效率;联合搜索应用中的列表融合排名算法因忽视了对列表可信度有效考量,影响了列表融合的质量;针对人员对象:热点人物发现应用中的直接排名算法由于忽视了图上某些关键信息的作用,影响了算法的排名质量;投票选举应用中的融合排名算法由于没有区分不同排名信息的可信度,影响了投票列表融合质量的进一步提升。为了达到提高排名质量和排名效率的目的,就需要对现有算法进行各方面的性能优化。在本文中排名效率方面的优化或排名质量方面的优化均称为排名方面的性能优化。为了实现对排名算法的优化,除了需要充分利用图中的多种特征和信息外,还需要全面地度量不同类型的可信度。因此关于一般对象的排名,针对直接搜索和联合搜索这两种应用场景中的排名问题本文分别提出了:基于强连通分量的网页排名高效方法和基于列表可信度的列表融合方法;关于人员对象的排名,针对热点人物发现和投票选举这两种应用场景中的排名问题本文分别提出了:综合多因素的人员影响力排名方法和基于排名可信度的投票列表融合方法。由上可知,本文的工作内容主要包括以下几点1)基于强连通分量的网页排名高效方法。在这一部分中,基于图上的强连通分量SCC(Strongly Connected Component)子图,分析并利用SCC在网页排名计算中所表现出的特点和性质,提出了一种基于强连通分量SCC的高效优化算法。在算法的研究过程中,通过提出严格的理论基础,为这些算法的正确性提供了强有力的保证。另外,在分析总体规律的同时,也讨论了具体情况下的优化处理措施,全方位地提高了算法的效率。(2)基于列表可信度的搜索列表融合方法。本部分致力于将由多个检索系统返回的多个不同列表融合为一个更加可信的综合列表。由于不同的检索系统,因其底层数据及排名算法的不同,必然导致它们所返回的排名列表质量不同。因此在融合多个列表时,对于那些排名质量高的列表所给出的排名信息,应更加予以采信。基于此,本部分致力于在多列表融合过程中无监督地度量出每个列表的可信度,使得高可信度的列表所给出的排名在综合排名时发挥更大的作用,从而达到有效提高列表融合质量的目的。(3)综合多因素的人员影响力排名方法。和以往的排名算法不同,本部分在考虑结点间关系的同时,将综合考虑那些反映人员对象自身重要性的信息,从而使得某个人员的排名结果不仅仅依赖于其外在关系(其他结点对它的认可)所反映出的社交能力,也依赖于其自身信息所反映出来的业务能力,从而使得排名结果更全面地反映出人员的综合重要性,有效提高了排名结果的排名质量。另外,在度量人员自身实力时,还考虑了时间信息,度量了人们随着时间的流逝所引起的主观认知方面的遗忘衰减作用的大小,使得排名结果能够更加准确地反映出在某个特定时间下的人员综合影响力的排名情况。(4)基于排名可信度的投票列表融合方法。本部分针对一种特殊的列表:投票列表,提出一种将众多投票列表融合为一个综合投票结果列表的算法。在融合众多投票列表时,不同的投票人由于其文化背景和综合能力的不同,导致其所给出的投票列表的可信度也不同;另外,即使在同一个投票列表中,由于投票人对候选人的“了知度”的不同,导致同一个投票列表中关于不同候选人的排名信息的可信度也不同。本部分提出的算法,不仅无监督地度量了每位投票人的可信度,也度量了每位投票人对每位候选人的“了知度”,并依据这些数据得到每条排名信息的可信度。在融合众多投票列表时,更加采信那些高可信度、高了知度的排名信息,从而提高了投票列表融合的质量。总之,本文致力于为用户提供更加满意的排名服务,这就需要从各个角度对现有算法进行优化研究。在排名对象上,本文不仅提出了针对一般对象的排名,也提出了针对人员对象的排名。在应用场景上,本文分别针对直接搜索、联合搜索、热点人物发现和投票选举四种应用场景,分别分析了这些应用中各自需要解决的排名问题,并提出了相应的算法。在排名方式上,分别研究了直接排名和列表融合两种排名方式。本文提出的这些算法从不同角度有效提高了列表排名的效率和质量。
可参考影乐酷网站https://www.yingleku.com