打印本文 打印本文 关闭窗口 关闭窗口
Google站长指南(翻译)
作者:武汉SEO闵涛  文章来源:敏韬网  点击数787  更新时间:2006/4/29  文章录入:mintao  责任编辑:mintao

原文地址: http://www.ljf.cn/ReadArticle.asp?id=172

题起: 近来SEO越来越热,自觉不自觉地听到了一些消息,突然想到google对这方面的行为应该早有准备,于是想查查官方的文档到底是怎么说的,哪知中文版还没有出来,于是找到英文版,遂起了翻译之念,用了半个上午的时间译得一篇,发表以此,以飨同道.

英文来源: http://www.google.com/webmasters/guidelines.html

站长指南 (翻译)

遵循这些指南能帮助google查找、索引和排列你的网站。即使你一点也不想遵循这些建议,我们仍强烈建议你了解一下“质量指南”这一节,它列出了一些会被 google视为作弊而导致整个网站不再被google收录的设计行为。一个网站一旦被google视为作弊,它将不再在Google.com以及所在 google的合作网站的搜索结果中出现。

设计以及目录指南

1,清析的层次以及文本链接。每一页都应该至少有一个静态链接。
2,为你的用户提供一张网站地图,使用户可以通过地图找到网站的要点。如果地图上的链接太多,你还可以把地图分成多个页面。
3,创建有用的、信息丰富的站点,并使网页清晰准确地表达你的观点。
4,考虑使用者会使用什么关键词来查找你的网页,并确保你的网页上包含相应的内容。
5,尝试使用文本而不是图片来显示重要的标题、内容或者链接,google爬虫目前仍不能识别图片上的文字。
6,确保你的TITLE和ALT标签包含有适当、准确的描述词语。
7,检查死链接并且纠正这些HTML。
8,如果你使用动态页,务必明了搜索爬虫在搜索这些网页时效果不像静态页好。使用较少的参数和短的参数对此有所帮助。
9,同一页面内的链接保持在一个合理的水平(少于100个)。

技术性指南
1,使用像Lynx这样的文本浏览器来检查你的网站,因为绝大多数的搜索爬虫察看你的网站的方式与之非常相似。如果像Javascript,cookies, session IDs,frames,DHTML或者flash这样的特性使你的网站在Lynx文本浏览器中显示不正常的话,那么搜索爬虫在抓取你的网站时也会碰到相同的困难。
2,允许搜索爬虫直接通过链接抓取你的网站而不需要通过session IDs和参数。这些技术对跟踪用户的使用习惯非常有用处,但搜索爬虫访问的方式却是完全不同的。使用这些技术会致使google不能完整地收录你的网站,因为搜索爬虫不能区别指向同一页面,但含有不同参数的URL。
3,确保你的服务器支持If-MOdified-Since HTTP header。这个特性允许你的服务器告诉google你的网站在我们上一次抓取之后是否更新过。
4,确保在你的站点根目录中持有robots.txt文件。这个文件会告诉爬虫哪个目录可以抓取,哪个目录不需要被抓取。确保它出现在你的网站上,以免你一不小心屏蔽了google爬虫。访问http://www.robotstxt.org/wc/faq.html可以学习到如何设计一个robots.txt文件来指导爬虫访问你的网站

5,如果你的公司购买了信息管理系统,确保它可以导出静态的html文件以便搜索爬虫可以抓取它。
6,不要使用“&id=”作为URL的参数,因为我们不会把这样的页面放进索引中。

当你的网站开始运作时:
1,跟你的同类网站作交换链接。
2,把它提交到Google,地址:http://www.google.com/addurl/?continue=/addurl
3,提交网站地图到Google Sitemaps(Beta)项目。Google Sitemaps使你的提交的网站地图来确定你的网站结构,并且以此生成网站的索引。
4,确保你被引用的网页处于可用状态。(原文比较难懂,附于此:Make sure all the sites that should know about your pages are aware your site is online.)
5,提交你的网站到关系目录服务商的网站例如Open Direcotory Project 和 Yahoo!,包括别的专业性行业
索引网站。

[1] [2] 下一页  

打印本文 打印本文 关闭窗口 关闭窗口