搜索技术入门到精通

Wednesday, May 09, 2007

第五章 5.3 影响排名的其他因素 Other Factors

域名中以goveduorg结尾的网站应该具有较高的网页权值。Gov是政府网站后缀,edu是教育机构,org指非盈利的组织。

搜索引擎的基本设计思路是若干个结果去覆盖相应用户需求,其中可能有大量不相关的内容存在,如果使得比较优质的结果保留下来,并且能使得后面使用的用户能方便地搜索到?点击率成了重要的判断数据。因此,上一节中提到的得分公式变为Score(A) = PageRank(A) × β + M’ * i * j + CTR。这样一来,保证了优质的结果能长期占据搜索结果第一页的位置。

其中,CTR的数据来源由两部分组成:

1) 搜索列表页面中的点击记录。

2) ToolbarGoogle)跟踪到的用户访问网页的频率,以及这些目标网页中链接的点击记录。

如果同一个网站多个页面都占据了第一页的结果,会造成搜索结果的不公正,需要对同一个网站的其他页面乘以一个衰减系数,调整第一页排名网站的构成。

对于排名优化的作弊网站,需要跟踪其在搜索引擎中得到流量的表现情况。如果作弊程度严重的,给予一定惩罚。

No comments: