是我们必须处理的基本概率
Posted: Thu Jun 12, 2025 6:22 am
PageRank 最初是一种利用链接来估算用户访问页面概率的方法,它本身就相当有趣,因为它表明它是一个与受欢迎程度相关的模型。所以,我们现在谈论 PageRank 时,经常会提到可信度、权威性之类的概念。我相信这些概念与 PageRank 息息相关,但值得记住的是,它最初是一种有效衡量页面受欢迎程度的方法。
请注意,我说的是页面,甚至不是域名。想象一下,互联网上有一个页面,也就是我在这里标记的页面 A。如果互联网上有一个页面,那么估计随机浏览器访问该页面的概率并不难。他们肯定访问了这个页面。如果我们引入第二个页面,估计概率仍然不难,我们假设概率是 50%,以此类推。
链接概率
这。但是,我们可以稍微偏离主题,或者在一个页面链接到另一个页面的情况下添加一些趣味,这显然是我们感兴趣的。例如,如果A链接到另一个页面,而互联网上目前只有两个页面,那么忽略其他的框,它们稍后会出现,互联 奥地利 电报电话列表 网上只有两个页面链接到A,而A链接到另一个页面。
假设这个概率的 0.85 倍通过。0.85 是一个相当随意的常数。这来自一篇旧的 Google 文档。它可能不是完全正确的值,但出于演示目的,它没问题,而且这是我们能想到的最好的值。
那么,在这种情况下,我们为什么要说 0.85 呢?为什么不说这个页面的所有用户都会点击呢?因为我们假设其中一些用户会去做自己的事情,停止浏览互联网,去做其他事情。事实证明,在一个页面在更大的网络中相互连接,而不是仅仅通过一个方向的链接的世界里,这个抑制因素非常重要。
请注意,我说的是页面,甚至不是域名。想象一下,互联网上有一个页面,也就是我在这里标记的页面 A。如果互联网上有一个页面,那么估计随机浏览器访问该页面的概率并不难。他们肯定访问了这个页面。如果我们引入第二个页面,估计概率仍然不难,我们假设概率是 50%,以此类推。
链接概率
这。但是,我们可以稍微偏离主题,或者在一个页面链接到另一个页面的情况下添加一些趣味,这显然是我们感兴趣的。例如,如果A链接到另一个页面,而互联网上目前只有两个页面,那么忽略其他的框,它们稍后会出现,互联 奥地利 电报电话列表 网上只有两个页面链接到A,而A链接到另一个页面。
假设这个概率的 0.85 倍通过。0.85 是一个相当随意的常数。这来自一篇旧的 Google 文档。它可能不是完全正确的值,但出于演示目的,它没问题,而且这是我们能想到的最好的值。
那么,在这种情况下,我们为什么要说 0.85 呢?为什么不说这个页面的所有用户都会点击呢?因为我们假设其中一些用户会去做自己的事情,停止浏览互联网,去做其他事情。事实证明,在一个页面在更大的网络中相互连接,而不是仅仅通过一个方向的链接的世界里,这个抑制因素非常重要。