首页 > 问答 > robots.txt的写法,屏蔽网站某一个目录下面的全部网页(悬赏1元

robots.txt的写法,屏蔽网站某一个目录下面的全部网页(悬赏1元

[导读]:Disallow:/data/ (代表着禁止蜘蛛抓取data目录后所有的页面) Disallow:/data (代表着data文件后边的网页被屏蔽) 假设我的www.123.com       我不希望收录www.123.com/data/abc/xxx.html  ...

Disallow:/data/ (代表着禁止蜘蛛抓取data目录后所有的页面)

Disallow:/data (代表着data文件后边的网页被屏蔽)

假设我的www.123.com       我不希望收录www.123.com/data/abc/xxx.html    中/data/目录下所有的网页    因为/data/是网址目录,不是网站文件目录

那么我在robots。txt里面应该写那个

顺便能解释一下,上面那2个有什么区别吗?

不要理解错了  搜索引擎也是和用户一样,访问的是html网页,而不是根据你网站程序的路径,去访问这些文件

so,Robots.txt其实是针对URL而言的,这个问题其实 百度站长平台提供了有更详细的答案。

并且站长工具的robots.txt检测工具也完全能够帮助你写出正确的robots.txt

QQ截图20170518170521

Disallow:/data/   和Disallow:/data  都能够匹配到你问题的中URL   

区别就是,后者还会匹配到  

###

这里我想问下,如果不是文件目录,它怎么可能是网址目录?所以,data肯定是文件目录。

如果想禁止抓取data目录下网址,可以这样写试试:Disallow: /data/*.html 禁止访问/data/目录下的所有以".html"为后缀的URL(包含子目录)。

Disallow:/data/ (代表着禁止蜘蛛抓取data目录下面的所有页面,但是data这一级是可以抓取的。

举个例子: 可以被抓取。不可以被抓取。

Disallow:/data (代表着禁止蜘蛛抓取data整个目录,含data这个目录级别。)

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/47335.html