网站地图可以帮助网站将需要进行索引的页面或新添加的页面展示给访问者和搜索引擎。笔者将向大家简要介绍网站地图的标准。
每个网站都有一个共同的目标,就是增加网站用户流量,提高网站页面的浏览量。提高网站流量的一个办法就是对网站进行“搜索引擎优化”工作。另一种方法则是使用网站地图。网站地图可以让网站站长确定哪些页面是需要搜索引擎进行索引或收录的。网站地图的概念最早是由Google提出的,而Yahoo!和MSN也都表示支持这一标准。在本文中,我将向大家介绍一下网站地图标准。
制定标准的目的 搜索引擎通过一种叫做网络蜘蛛的机器人程序在网络上不断地搜索和定位网页,对网页内容进行索引并将其收入到搜索引擎的数据库中。这一过程对网页资源相当敏感,有时候你希望被检索的网页反而会被搜索引擎忽略,而那些不太重要的页面却被搜索引擎收录了。比如Google的 Googlebot网络蜘蛛,就是专门在网络上寻找改变的以及新增的网页,并对其进行索引和收录。
网站地图则提供了一种方式,可以让网站告诉搜索引擎机器人,那些页面要被检索,哪些页面有更新的内容。基本上说,网站地图在网站和搜索引擎之间建立了一条沟通的渠道。理论上讲,网站地图可以在一定程度上降低网络蜘蛛的数据处理量,减轻程序的工作负担,但是目前网站地图还不能取代搜索引擎的处理过程。
什么是网站地图? 网站地图是一个xml文件,其中包含了网站URL的列表以及相关的属性,告诉搜索引擎那些页面需要进行索引,并且网站地图必须采用UTF-8编码。对于一个网站地图来说,以下几项元素是必需的:
--网站地图以此标签作为开始和结束标记,并且开始标签中必须包含命名空间(xmlns)属性。
--网站地图中包含的页面URL都要写在此元素中。
--文件中指定的页面的真实地址。这是元素的子元素。 另外,网站地图文件中也可以包含以下可选的元素:
--这是 元素的子元素,用来标记某个页面的最后更新时间。
--这是元素的子元素,用来标记某个页面的更新频率(参数包括always, hourly, daily, weekly, monthly, yearly, 或者never)。
--这是 元素的子元素。用来标记某个页面与其它页面之间的重要程度,其数值从0.0到1.0,默认情况下,每个页面的优先级都是0.5。 以下是一个网站地图的范例文件,大家可以通过这个范例学习如何使用相关元素。该网站地图文件中指定了网站的首页,以及页面的更新频率,最后更新时间,以及相对站点的其他页面的优先级。
<URLSETXMLNS="HTTP: 0.9?; sitemap schemas www.sitemaps.org>http://www.test.com/<;/loc>2006-11-20daily0.3 网站地图文件的存放位置并没有固定要求,但是它的位置可能会影响文件内部的URL。比如,如果上面那个例子中的网站地图文件位于http: //www.test.com/sitemap.xml,那么站点地图中包含的任何URL都会是以http://www.test.com/开头的。因此,建议大家将网站地图文件存放在网站根目录下。另外,网站地图文件的大小不要超过10MB。如果网站地图文件的体积超过了10MB,也可以通过zip将其进行压缩后再存放在根目录下。
创建网站地图查看本文的国际来源 由于网站地图文件是由XML语言编写的,因此你可以使用任何文本编辑工具来创建或编辑网站地图文件。不过我下面将要介绍的,是几款专门用来创建和编辑网站地图文件的工具:
Node Map: 用来创建和校对网站地图文件的工具。
Gsitemap: 采用 .NET Framework开发的网站地图文件生成工具。
GSiteCrawler: 基于Windows的创建网站地图文件的工具。
phpSitemapNG: 由 PHP编写的免费网站地图生成工具。
Google Sitemap Generator: 用于创建网站地图文件的 Python 脚本。 提交到搜索引擎 一旦你的网站拥有了网站地图,接下来要做的就是将网站地图文件提交给搜索引擎。每个搜索引擎都有自己的提交界面。Google将网站地图的提交页面作为了 Webmaster工具的一部分。你必须进行注册才可以提交网站地图文件。Yahoo!则提供了一个免费的提交页面,让用户提交自己网站的网站地图,但是使用前仍然需要登录。随着其它搜索引擎对网站地图标准的支持,它们也会提供与Google, Yahoo!以及MSN类似的提交方式。
其他工具 搜索引擎对于网站内容的检索是一个缓慢的过程,它对内容相当敏感。而网站地图则为搜索引擎提供了一条捷径,告诉搜索引擎应该检索哪些内容。网站地图文件是由XML语言编写而成的,虽然使用简单的文本编辑工具就可以创建和编辑网站地图文件,但是我们也可以使用各种专用的生成工具。目前来看,网站地图标准还只是搜索引擎工作过程中的一个附加补充。
|