求介绍一款工具,查询所有被百度收录的但已经删除的页面。。
思路如下
遍历服务器日志里被百度蜘蛛抓取过的所有链接,筛选出返回 404 状态码的网址
让运维或懂 shell 的人写个脚本即可
这个只能分两步做,先获取已经被百度收录的页面,然后访问这些页面看是否返回404,返回404就表示已经收录但是被删除的页面。应该没有那个公开的工具把这两步都做了,而且这个工具感觉没什么价值。
你倒不如把所以删除的页面在百度站长平台提交死链,已经收录的被删除的自动被百度清楚。
不太明白你这个
### 方法一第一步:获取到过期的百度快照,直接点击进入快照页面
方法一第二步:点击“投诉快照”即可跳转到百度快照删除与更新页面
方法一第三步:填写上自己的联系邮箱,点击提交。百度会在提交完成后就反馈一个邮件给你,告知你百度已收到该反馈。等百度官方审核后,符合删除要求的将予以删除。
方法二第一步:获取到过期快照链接
方法二第二步:直接到百度快照删除与更新页面 (网址为:)填写获取到的链接和你的联系邮箱,按要求填写提交。
方法二第三步:百度会在提交完成后就反馈一个邮件给你,告知你百度已收到该反馈。等百度官方审核后,符合删除要求的将予以删除。
方法三:在网上找到IIS7站长之家,点击进入,在首页的WEB工具中,找到网站批量查询功能,点击进入后也可以查到详细的关于百度收录的信息。
###在查收录上,这方面感觉的确缺好的工具,要是百度统计或者百度站长能把所有已经收录的URL列出来就好了。
或者能让Site命令和索引量统一,这样site命令再采集所有url也行。
应该怎么计算呢?算法是啥?数据应该是哪些
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/74633.html