打印本文 打印本文 关闭窗口 关闭窗口
Google的集群技术 另一高峰?
作者:武汉SEO闵涛  文章来源:敏韬网  点击数627  更新时间:2009/4/24 22:01:50  文章录入:mintao  责任编辑:mintao

  Google公司刚刚暗示了他们在加强互联网搜索中的下一步工作,而集群技术在其中将扮演重要角色。

  在一次研发工作实验室组长级别的Web2.0座谈会上,Google的重要研发人员之一预展说道,他们公司将在实体和词语两者上使用集群技术,以便使引擎更好地领悟用户的搜索意愿,并从互联网上充分过滤出这些信息。

  Google的搜索质量监督主管Peter Norvig说,Google搜索网站的另一块空间将用作静态的机器翻译,可以将当前的Web页面转为其它语言。

  在集群技术方面,Norvig讲述了他们公司已经进行了六个月的,一个名叫“named entities abstraction(命名实体提取)”的工程项目,该项目中,Google的研发人员正在分析公司庞大的Web索引,以便从内容结构中提取实体——例如某个公司的名称等,并解开索引和实体之间的相互关系。

  例如,研发人员正在寻找这样一种方法,能够寻找到一个词组中有“such as(例如)”这样的字眼,然后紧紧抓住之后的名词,对其展开搜索。这样做的目标不仅仅是要抓住这个名词,而更是要抓住这个名词的词群。这种情况下,如果一个名词中出现“Java”这个词,就不仅会和计算机语言关联起来,而且还会和日常生活用语关联起来,Norvig介绍说。

  他说,词语集群技术的关键在于,它能使搜索引擎更好地理解一个词语的不同意思,而Google着手这项技术已经有三年之久了。

  迄今为止,Google还没有公开使用过任何集群方法,尽管Norvig在一次采访中表示,这次座谈会后集群方法可能在Google实验室的测试版中使用。

  Google实验室经常打造出被公众认为是全新献礼的特性与服务。而新闻提示和Google的本地搜索功能已经处于实验室里的出炉状态了。

  越来越多的新兴的搜索公司都正在将目光瞄准搜索结果的自动集群。Vivisimo公司是新兴搜索公司中最有名的几家之一,他们最近推出的Clusty搜索网站,正是利用将其它搜索引擎的结果集群化、种类化来实现搜索结果的。

  Norvig说,虽然对于那些新兴的搜索公司,展开集群技术可能是一种取胜的方法,但Google公司认为这项技术目前还太不成熟。他说,现在该技术只能对极小一部分搜索结果有较好的作用,因此Google的精力主要集中在对该技术的改良,以及增强其实用性方面。

  如果算上机器翻译,Google的Web索引就将变得极为巨大,共包括60亿个文件、图像和条目,同样,它的计算资源也将变得极大。目前,Google正以拥有数千个Linux服务器组成的集群,这也是全世界最大的Linux服务器集群之一而闻名。

  目前,Google已经提供了一项Web页翻译的功能,但Norvig说这是由第三方技术提供的。他还说,他们公司现在项目中的翻译功能是由自家开发的,它能够更灵活地翻译Web页文字和链接。

打印本文 打印本文 关闭窗口 关闭窗口