域名中以gov,edu,org结尾的网站应该具有较高的网页权值。Gov是政府网站后缀,edu是教育机构,org指非盈利的组织。
搜索引擎的基本设计思路是若干个结果去覆盖相应用户需求,其中可能有大量不相关的内容存在,如果使得比较优质的结果保留下来,并且能使得后面使用的用户能方便地搜索到?点击率成了重要的判断数据。因此,上一节中提到的得分公式变为Score(A) = PageRank(A) × β + ∑M’ * i * j + CTR。这样一来,保证了优质的结果能长期占据搜索结果第一页的位置。
其中,CTR的数据来源由两部分组成:
1) 搜索列表页面中的点击记录。
2) Toolbar(Google)跟踪到的用户访问网页的频率,以及这些目标网页中链接的点击记录。
如果同一个网站多个页面都占据了第一页的结果,会造成搜索结果的不公正,需要对同一个网站的其他页面乘以一个衰减系数,调整第一页排名网站的构成。
对于排名优化的作弊网站,需要跟踪其在搜索引擎中得到流量的表现情况。如果作弊程度严重的,给予一定惩罚。
No comments:
Post a Comment