[导读]:因我网站比较多,而且都需要调用JS,现情况如下: A站根目录下有个文件夹/APPJS/ B站、C站、D站...首页都需要调用A站/APPJS/文件夹下的jump.js文件 因为不想搜索引擎抓取到这个跳...
因我网站比较多,而且都需要调用JS,现情况如下:
A站根目录下有个文件夹/APPJS/
B站、C站、D站...首页都需要调用A站/APPJS/文件夹下的jump.js文件
因为不想搜索引擎抓取到这个跳转的JS
我在A站的robots.txt文件里面是这样写的
user-agent:*
disallow:/APPJS/
请问还需要在B站、C站、D站....里面放上这个robots语句吗?
[我个人是觉得在B站、C站、D站....里面的robots文件里也要放上因为不放上的话蜘蛛直接抓取下载分析了,但一时找不到说服自己的理由,终究还是技术渣渣,特来问下前辈]
B站、C站、D站...调用的A站JS文件,指向的地址也是A站的,所以只需要针对A站做下屏蔽就行了。
问题是,百度蜘蛛是不听话的,有的你屏蔽了照样抓取
一个网站一个Robots,这是一个规则,二级域名也是一个网站
所以每个网站都需要配置robots.txt文件
Disallow: /APPJS/
或者
Disallow: /APPJS/
Robots.txt只是针对搜索引擎抓取设置的,如果B,C,D网站根目录下面有/APPJS/文件夹,那么就需要加robots.txt禁止,如果BCD站根目录下面没有APPJS这个文件夹就不需要加robots.txt屏蔽
###一个网站对应一个Robots,域名都不一样,路径也都不一样
###如果其他的两个网站也不想被抓取,那么也需要写相应的Robots
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/38093.html
