【Robots.txt】robots.txt写法_怎么写robots

云码酷  于 2018-4-26 21:52:11 回帖奖励 |阅读模式
1 2591

马上注册,自学更多教程,下载更多资源。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
  robots是站点与spider沟通的重要渠道,站点通过robots文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

  robots文件往往放置于根目录下,包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

  &quot;<field>:<optional space><value><optionalspace>&quot;

  在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:

  User-agent:该项的值用于描述搜索引擎robot的名字。在&quot;robots.txt&quot;文件中,如果有多条User-agent记录说明有多个robot会受到&quot;robots.txt&quot;的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效,在&quot;robots.txt&quot;文件中,&quot;User-agent:*&quot;这样的记录只能有一条。如果在&quot;robots.txt&quot;文件中,加入&quot;User-agent:SomeBot&quot;和若干Disallow、Allow行,那么名为&quot;SomeBot&quot;只受到&quot;User-agent:SomeBot&quot;后面的 Disallow和Allow行的限制。

  Disallow:该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。例如&quot;Disallow:/help&quot;禁止robot访问/help.html、/helpabc.html、/help/index.html,而&quot;Disallow:/help/&quot;则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。&quot;Disallow:&quot;说明允许robot访问该网站的所有url,在&quot;/robots.txt&quot;文件中,至少要有一条Disallow记录。如果&quot;/robots.txt&quot;不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。

  Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL 是允许robot访问的。例如&quot;Allow:/hibaidu&quot;允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

  使用&quot;*&quot;and&quot;$&quot;:Baiduspider支持使用通配符&quot;*&quot;和&quot;$&quot;来模糊匹配url。

  &quot;*&quot; 匹配0或多个任意字符

  &quot;$&quot; 匹配行结束符。

  最后需要说明的是:百度会严格遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写,百度会对robots中所写的文件和您不想被抓取和收录的目录做精确匹配,否则robots协议无法生效。


上一篇:【Robots.txt】百度站长平台robots工具升级公告
下一篇:【Robots.txt】使用robots巧妙避免蜘蛛黑洞

云码酷 - 论坛版权1、本主题所有言论和图片纯属会员个人意见,与本论坛立场无关
2、本站所有主题由该帖子作者发表,该帖子作者与云码酷享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和云码酷的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
7、云码酷管理员和版主有权不事先通知发贴者而删除本文

| 0 人收藏
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    0

    主题

    214

    帖子

    214

    积分

    中级会员

    Rank: 3Rank: 3

    积分
    214
    发表于 2018-4-27 10:40:02 | 只看该作者
    沙发
    打酱油的人拉,回复下赚取积分
    回复 支持 反对

    使用道具 举报

    • 售后服务
    • 关注我们
    • 社区新手

    申请友链|Archiver|手机版|小黑屋|云码酷 ( 京ICP备13037810号 )

    Powered by Discuz! X3.2  © 2001-2022 云码酷