一、谷歌对网页级别的描述:作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,谷歌 就认为网页 A 投了网页 B 一票。谷歌 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,谷歌 还要分析投票的网页。重要的网页所投出的票就会有更高的权重,并且有助于提高其它网页的重要性。
重要的、高质量的网页会获得较高的网页级别。谷歌 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,谷歌 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。谷歌 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。
二、PR值算法原理总体上基于下面2个前提:1、一个网页被多次引用,则它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威网页。2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值。 |