小小SEO之写个Wordpress的robots.txt

2008年5月9日 由 木鱼猫 留言 »

点石互动那里看到一篇讲解如何写robots.txt的文章,想起来自己网站的robots一直没有弄过,按照文章介绍的方法写了下应用在Wordpress架设的blog中的robots文件,具体代码如下。


User-agent: *
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: /comments/feed/
Disallow: /images/
Disallow: /comments/
sitemap: sitemap.xml

robots分析:对所有搜索引擎的机器人(User-agent: * 下面的部分)指定一些不允许访问抓取的目录,例如wordpress文件目录,feed目录,评论以及图片目录等。其他目录下内容可以正常访问抓取。
并附上使用wordpress插件自动生成的Sitemap的路径,方便搜索引擎机器人进行抓取。
#知识补充:

robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

#本文部分内容参考了文章《如何写robots.txt?》

相关日志

留下评论

:o) :-D :-( ;-) :-P =-O 8-) :-/ O:-) :-! >:o C:-) :-(|) O-) :@ :-[ (B) (^) (P) (@) (O) (D) :-S ;-( (C) (&) :-$ (E) (~) :-* (I) (L) (8) (T) (G) (F) (*) (N) (Y) (U) (W)
Follow me on Twitter