【Robots.txt】robots.txt是什么?

云码酷  于 2018-4-26 21:51:13 回帖奖励 |阅读模式
1 2448

马上注册,自学更多教程,下载更多资源。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
robots.txt是什么?
  有没有想过,如果我们某个站点不让百度和google收录,那怎么办?
  搜索引擎已经和我们达成一个约定,如果我们按约定那样做了,它们就不要收录。
  这个写约定的的文件命名为:robots.txt。
  robots.txt是一个最简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。
  关于robots.txt一般站长需要注意以下几点:
  如果你的站点对所有搜索引擎公开,则不用做这个文件或者robots.txt为空就行。
  必须命名为:robots.txt,都是小写,robot后面加"s"。
  robots.txt必须放置在一个站点的根目录下。如:通过http://www.seowhy.com/robots.txt 可以成功访问到,则说明本站的放置正确。
  一般情况下,robots.txt里只写着两个函数:User-agent和 Disallow。
  观察这个页面并修改为自己的:http://www.seowhy.com/robots.txt
  有几个禁止,就得有几个Disallow函数,并分行描述。
  至少要有一个Disallow函数,如果都允许收录,则写: Disallow: ,如果都不允许收录,则写isallow: /  (注:只是差一个斜杆)。
  补充说明:
  User-agent: *  星号说明允许所有搜索引擎收录
  Disallow: /search.html   说明 http://www.seowhy.com/search.html 这个页面禁止搜索引擎抓取。
  Disallow: /index.php?   说明类似这样的页面http://www.seowhy.com/index.php?search=%E5%A5%BD&action=search&searchcategory=%25 禁止搜索引擎抓取。
转自搜外


上一篇:【Robots.txt】Robots.txt 文件应放在哪里?
下一篇:【Robots.txt】robots.txt文件的重要作用意义

云码酷 - 论坛版权1、本主题所有言论和图片纯属会员个人意见,与本论坛立场无关
2、本站所有主题由该帖子作者发表,该帖子作者与云码酷享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和云码酷的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
7、云码酷管理员和版主有权不事先通知发贴者而删除本文

| 0 人收藏
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    2

    主题

    187

    帖子

    189

    积分

    注册会员

    Rank: 2

    积分
    189
    发表于 2018-4-27 05:22:45 来自手机 | 只看该作者
    沙发
    看帖要回,回帖才健康,在踩踩,楼主辛苦了!
    回复 支持 反对

    使用道具 举报

    • 售后服务
    • 关注我们
    • 社区新手

    申请友链|Archiver|手机版|小黑屋|云码酷 ( 京ICP备13037810号 )

    Powered by Discuz! X3.2  © 2001-2022 云码酷