首页 > 问答 > 由于大量采集被百度降权,现在需要把大量的采集内容都删了吗

由于大量采集被百度降权,现在需要把大量的采集内容都删了吗

[导读]:我司网站是某个行业的领军网站,建站已经有8年之久,在百度中表现一直非常好。 正常每日IP在10万左右。 去年为了赚取更多的流量,我们在网站下建立了30个左右的目录,并采...

我司网站是某个行业的领军网站,建站已经有8年之久,在百度中表现一直非常好。
正常每日IP在10万左右。
去年为了赚取更多的流量,我们在网站下建立了30个左右的目录,并采集了大约1000万个网页,这些网页和网站的核心内容并不是非常相关。
采集初期,这1000万个网页给网站每日带来50万左右的IP,这样的情况持续到了2013年12月31日。
从2014年1月1日起,网站被百度严重降权。采集的1000万网页流量从百度来的流量接近0。
网站核心内容的排名也大幅下降。但是网站首页的核心关键词排名还是不错。但是网站的所有内容都被降权,现在日IP只有5万左右。而这5万IP绝大多数都是从360、搜狗来的。百度来路只占5%。

现在我司对网站进行了全新改版,纠结的是,采集的1000万网页是否需要删除?删除了会不会因为超大量的404页面而被百度等搜索引擎继续降权。如果不删,怎么做才能恢复排名。

1000万收录了多少? 1000万删除?
个人觉得是 删除1000万页面,死路一条!
不删,继续优化,停止采集,猛加原创,稀释这1000万的数据。

###

Robots.txt分阶段的屏蔽,让这部分的内容逐步的消失,然后再删除。

直接删除对网站的影响可能是毁灭性的。

###

不删除,但可以尝试下 将你说的 那些目录 Robots禁止百度抓取。

###

分阶段的删除,这些垃圾内容存在也会影响到网站的关键词的排名;
如果一次性删除完的话,产生那么多404,大量的404会导致网站排名掉得更厉害。
减少这些页面的入口,分阶段的删除,做好404,然后提交百度。
每天删除一些,再每天补回一定量的伪原创与原创。

###

13年7月份,我公司网站导入10w相关采集论文,网站被降权,删除所有页面,也没有做死链接提交,直到现在网站一直半死不活的。

###

删除,做404,提交百度,并屏蔽相关外链。

本来可以用二级域名做的。

###

采集的1000万不太相关,带来的50万流量,我想跳出率会很高。用户体验度下降了,导致的降权。
如果通过数据分析,确定是这个原因。
建议如下
Robots屏蔽掉这三十个目录,但不要删除,收录页面数据波动太大,只会死的更惨 。
从用户体验的角度出发,再不断更新大量高质量的文章。两三个月后,还不恢复的话,再买批高质量的友情链接刺激一下,分阶段添加,不要只做首页的友链,权重页也要加。

###

跟你分享下我曾经操作过的一个企业站的案例,我觉得很适合你目前这个站采用。当时我接手那个站的时候,之前的优化人员给那个网站总共400多篇的文章全是采集复制的。百度的收录率1%都不到,网站结构还有问题,然后我就对网站进行改版啊!以前虽然那些内容没有收录,但是我也没删除,而采用了Robots,最后就是跟刘清文说得一样,照死更新原创文章,渐渐地出现收录>秒收>排名,就这么简单。不要删除,否则你会后悔。

###

要删除就全部删除,如果不删除那也不要去改动。

###

你网站的网址都没发出来,无法去分析,只能说你的采集是垃圾内容,如果有多人举报那你的网站基本是被秒杀,度娘也是严禁采集他人不相关内容的。你的站估计跟比比贴站一样,进入了垃圾行列,但你的没他的严重,要是我就狠下心来把那些栏目都全部给屏蔽了,然后全部删除,用站长工具提交死链接。我的站以前也是这样,我狠下心来删除2万多页面,大约快4个月网站全部恢复了

###

直接 Robots.txt 屏蔽抓取就好了,没必要大动干戈。

###

1、是不是100%确定期间只有做这一项大操作?是完全因为这1000W的数据而引起的吗?

2、如果你确定是因为这1000W的数据而引起的,你在确定下,这1000W的数据为什么会被降权?是因为这1000W的数据毫无价值还是怎么样?你确定它有价值吗?

3、如果确定有价值,那为什么要删除?优化1000W信息,让他更好的展现给用户,如果你不确定它是否有足够价值,你就全部删除404,这并不影响你的网页,反而是加分。

最后:你是不是应该想想怎么去把网站做好,难道你的网站没有其他内容可以在扩展的吗?真的没有数据可做了吗?为什么要去采集1000W数据来做这个?直觉告诉我,我根本不看内容,就知道这是1000W的垃圾。

###

1.分析1000w数据收录情况?
2. 重新检查1000W数据内容质量,删除为空的数据及未被百度收录的残缺数据;
3. 慢慢优化被收录的数据;
4. 重新制定新的优化方案加强原创的填充。

###

楼上这么多解决方案。
无论建议删除处理,还是保留处理,目的是让网站恢复健康水平。
1000W的不相关内容的大规模采集,是引起百度采取措施的主因。
从历届的算法来看,对这类站点的惩罚,一次比一次严重。
解决策略应该有以下几种,按优先顺序排:
1,着手制定高质量内容策略,对质量非常差的采集内容进行404处理,建议比例在20%左右。同时争取在最短的时间去稀释采集内容。
2,如果只是针对某个子站点或目录下进行采集的,可做屏蔽处理。
3,采集目录全面改版,重新做内容,之前采集的内容删除。
每个站点情况不同,“我司网站是某个行业的领军网站,建站已经有8年之久,在百度中表现一直非常好。”这种情况的站点,有恢复的机会。
个人的一点建议,欢迎指评。

###

既然不相关 留他何用?对用户无用的东西留着干啥?

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/23049.html