Home >  > Google搜索新索引系统Caffeine分析

Google搜索新索引系统Caffeine分析

0

Google在6月发表文章“我们的新搜索索引:Caffeine”,宣布Google搜索的新网络索引系统Caffeine的开发完成了,索引系统在搜索引擎的工作原理里,是一切的开始,因为搜索引擎其实搜索的是它本身建立的索引,而不是即时变化的互联网。

下面我们来探索一下Caffeine:

为什么要Caffeine?

看看Google怎么说的:

那么,我们为什么要创建一个新的搜索索引系统呢?网络的内容日益剧增,这不仅仅是数目和容量在增多。随着视频、图片、新闻和实时内容的出现,普通网页的内容更丰富也更复杂。此外,人们对搜索的预期也比以往更高。搜索者希望找到最新的相关内容,内容发布者希望在发布内容后立即被人搜索到。

是的,不断膨胀的互联网、实时内容搜索和个性化搜索的需要,在“对SEO在2010年的8个预测”这篇文章中,我们详细阐述了对实时搜索的一些分析和担忧,现在,你可以实实在在地在Google的搜索结果中体验这些。

那么Caffeine到底是什么?

Caffeine到底是什么?
我们的旧索引有多层结构,它们中间的更新速度不尽相同:有一些会比另外一些更新速度快,而主层则是几个星期更新一次。为了更新旧索引的一层,我们必须分析整个网络,这意味着,在我们找到网页与让您访问该网页之间,将会有很大的延迟。

在Caffeine系统下,我们分析网络的小部分,并在全球持续更新我们的搜索索引。当我们发现新网页,或现有网页出现新信息时,我们可以将其直接添加在索引中。这意味着您可以发现比以往任何时候都更新的信息――无论该信息是在什么时候、什么地方发布的。

 Caffeine索引架构

大意是Caffeine是一种新的搜索引擎索引系统(或索引方法),虽然在Webmasterworld的讨论里,有不同的意见,一种说Caffeine不只是索引系统的更新,而且还是算法的更新。但前Google网站管理员中心的Vanessa Fox说:

Caffeine只是Google搜索的索引架构(indexing infrastructure)的更新,并不牵涉到排名算法的改变。并且这个更新现在已应用于所有数据中心、地区和语言。

我们也认为Caffeine是索引系统的更新,但此更新会影响到网站在最终搜索结果页中的排名,尤其是那些可以在短时间内即被编入索引的“新鲜”内容对长尾关键字内容的冲击。

量变还是质变?
Google网络管理员中心的Maile Ohye说:

因为互联网的发展和进步,我们必须跟上这些前进的步伐,Caffeine于是随之而生,其目的是给搜索用户提供更合适的内容。

Google反垃圾小组的负责人Matt Cutts说:

Caffeine会让搜索用户和网站同时受益,因为有了Caffeine意味着网站内容(不仅仅是那些“实时内容”)会在被索引后几秒内就能被搜索到。

现在我们猜想Caffeine应有以下的变化:

•搜索引擎索引系统架构的更新: Google文件系统从GFS v1(Google File System)升级到GFS v2
•服务器数量和性能的提升
如果说从Caffeine代表着从GFS v1升级到GFS v2,那么无疑是质的飞跃;而服务器性能和数量的提高,可能就是量的变化。毫无疑问,Google在搜索引擎领域一哥的地位非常牢固,因这不仅需要技术上的创新,还需要庞大服务器和数据中心的支持,在这方面,相信Bing和百度在短时间内都无法与之相比。

为了服务日益增长的互联网内容、实时搜索和更复杂的个性化搜索,Google需要更多的服务器、更先进的数据中心及服务器技术来实现。据称Google是世界上拥有服务器最多的公司,超过100万台,同时,他们自己研究和设计更适合搜索的服务器和数据中心。我们都知道,数据中心的电力对于像Google这种拥有巨量服务器的公司来说,是占比非常高的成本,这就不奇怪Google曾收购过核能源公司、投资风力发电厂,有一天其本身成为能源公司也不足为怪。

SEO的灾难?
有不少人对Caffeine索引带来的搜索结果页的变化颇有微词,指Google为了让搜索结果保持新鲜,使一些原来在某些长尾关键字的网页被摒弃或排名被靠后。相信在以后的日子里,类似的垃圾网页是Matt Cutts们需要面对的难题,Google自己在博客上也说:

着眼于未来,我们创建了Caffeine。它不仅可以保证内容更新,还能为我们创建一个更快速全面、并且随着网络信息增长而扩展的搜索引擎打下坚实基础,从而为您提供更多相关的内容。请做好准备,在未来几个月里您可以见证更多的改进。

相关推荐

发表评论

You must be logged in to post a comment.