新睿云

> 知识库 > 链接算法-pagerank算法解析

链接算法-pagerank算法解析

作者/来源:新睿云小编 发布时间:2020-06-28

谈到网站推广,这里就不得SEO与SEM。

SEM不过是SEO推广的分支,这里暂且不谈。主要这是花钱既有展现,推广一旦停止既没有流量。

SEO涉及的算法就比较多了,其有一句为:“内容为王,外链为皇”。虽然外链的作用不断降低,不过目前在搜索中依旧占据举足轻重的地位。

本次我们谈一下链接算法始祖——PageRank算法

一、PageRank算法简述

1.PageRank算法

PageRank是网站投票的一个机制,比如A页面有B页面的链接,这就算是A给B的一个投票。这个投票中传递一个参数叫做“权值”。

当一个页面拥有很多网站的投票,则这个页面就越重要,接收到的权值多,也越容易受到搜索引擎的“青睐”。

2.PageRank算法中的链接陷阱

我们可以想象如果互联网不存在检索词,只有PageRank算法决定排名,则接收到权值最多的网站则排名越好。

所以也就出现了链接陷阱,比如D页面指向A,而这个A页面的关系却如下:

A→B→C→A

可以看到这就是一个链接陷阱,A、B、C绕了一圈就回去了,获取的权值会越来越多,却不会往外输出权值。其积累的权重会越来越多……

3.远程跳转

为了避免出现先前的链接陷阱,后续谷歌在算法中加入了链接远程跳转。

A→B→C→?

当一些页面互联一圈后,蜘蛛会在库中随机挑选URL跳出,把权值带走。

?中的页面是随机的跳转的,因此也叫远程跳转。

二、PageRank传值算法

假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

PageRank1 

重新假设B链接到A和C,C只链接到A,并且D链接到全部其他的3个页面。一个页面总共只有一票。所以B给A和C每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

PageRank2 

对于一个页面A,那么它的PR值为:

PageRank3 

PR(A) 是页面A的PR值

PR(Ti)是页面Ti的PR值,在这里,页面Ti是指向A的所有页面中的某个页面

C(Ti)是页面Ti的出度,也就是Ti指向其他页面的边的个数

d 为阻尼系数,其意义是,在任意时刻,用户到达某页面后并继续向后浏览的概率,

PageRank4 

该数值是根据上网者使用浏览器书签的平均频率估算而得,通常d=0.85

热门标签
new year
在线咨询
咨询热线 400-1515-720
投诉与建议
{{item.description}}

—您的烦恼我们已经收到—

我们会将处理结果发送至您的手机

请耐心等待