首页 > 问答 > 【求助】百度索引量近2亿,实际收录不到2千万,近期索引量下

【求助】百度索引量近2亿,实际收录不到2千万,近期索引量下

[导读]:直接上图 一呼百应 的百度索引量这么大,之前有一个同学是搜了网的SEO总监,一起去参加了百度的高级站长大会,他提到的问题和你类似。就是百度的索引量过亿,但Site的数值...

直接上图



一呼百应 的百度索引量这么大,之前有一个同学是搜了网的SEO总监,一起去参加了百度的高级站长大会,他提到的问题和你类似。就是百度的索引量过亿,但Site的数值却才1千万,我刚才看了下,目前还是一千万左右。
百度工程师在场的回复是,这是百度site数值的误差,以索引量为准。但问题是,site数值决定排名和流量,即只有site有的网页才参与排名。这个问题,百度工程师没给予回复。目前site数值与索引量的问题还是没完全解决中。

楼主的问题,我想可以参考下这个话题:http://ask.seowhy.com/question/8585
人人网的 @殷祎东 发起的。这个话题里那些回复很有价值,研究下会有启发,特别是通过在索引量里设置各个栏目、目录的针对性查询。从而获知,收录不理想的栏目。

楼主提到的一个特殊情况,即:企业发了很多信息,可能今天被抓取,第二天被删除的问题。
我想,如果这个情况数量确实庞大,是否可以利用下这个牛x的Nofollow标签。
我们可以对一些新注册的企业刚发布的N天之内的帖子,给予 nofollow。过了N天,这个帖子如果没被删除,则代表其质量过了贵网站的审核期,然后可以让蜘蛛抓取了。
这样利用nofollow来协调,有很多好处。望多加体会。

###

索引量亿,那当然索引还真心不靠谱。我有网站Site有46个,但是索引却只有2个。到底哪个准,还真说不清楚。

对于数据量如此之大来看,把握质量和重复内容都是B2B网站的难点。

【索引下降原因】我觉得是

没有实际内容、title相同的页面,例如列表页。

重复的内容,由于同类企业发布的信息,30%的内容重复不为过。一呼百应的每天发布率那么高,同类行业非常多,企业发布的信息几乎都是互联网相互抄袭,同时发布在一呼百应的几率也很大。

非法页面,B2B网站审核机制可以避免一些,用敏感词禁止。对于审核在如此在的发布量前提下,漏网之鱼不少。产生的404、500页面,提交百度也无补于事。论坛也会发生同类的问题,帖子在被收录后,才进行审核删除。很难避免的一个问题。

个人想到的方法:
1、尽量完善自身网站的审核机制,尽量避免产生这类页面。
2、多在站内企业后台发布系统中做提示,设置带“*”的填写项,尽量增加相应的创意设计。
3、对于审核删除产生的404页面,可以在Robots内建立一个:Disallow: / 相应禁止蜘蛛再次浪费。页面删除也尽量不要留有入口。
(PS。只能说尽量这个词,内容审核方面,目前就连百度也无法完美的做到垃圾内容一个都不收录的程度)

目前我也是B2B网站,但是索引与site的比例也在增加,由于我这边网站每天的企业发布量并不是很多,审核还行。但是重复内容却是目前的难题,毕竟企业行业都相同。也在此请教一呼百应的运营:【你们是如何避免企业发布的内容大量重复的问题呢?】

###

请教一下,百度索引量1亿,也太牛了,怎么才能增加百度收录量?

###

近期是这样的,我的也下降了

###

搜索引擎 建立索引基本过程:

WEB→Spider→线下存储库→页面分析→切词分词→建立倒排索引

现状:索引下降
常识:哪些情况会被清楚索引库
eg: 严重作弊内容页面、欺诈内容页面、不存在页面。。。。等等。

--------用数据来证明 现状-------------
维度细分、对比分析:
.细分索引下降在哪些频道,哪些内容页面。。。。
.爬虫日志方面对比。。。。。
.事件发生 前后工作记录进行对比 。。。。
.。。。。。。。。。。。。。。。。
.寻问相关百度人员。。(PS:有渠道的话)

###

很明显是网页内容的问题,很多网页质量不高。
可能存在大量的重复页面,重复内容。
想办法减少一些垃圾页面,提高页面质量咯~

举个例子,一个商家不能发部同样的内容超过2条,title不能一样,内容不能一样。内容介绍不能低于200字,引导用户去写一些原创的东西。

###

第一只能及时发现,及时删除
就好比之前网站被挂了很多非法页面,整理提交给百度,或者加大力度审核

###

保证重点页面被收录,保证流量趋势是上涨的就行了呗,毕竟能有排名的页面占收录页面的很小一部分,这个索引收录不用太关心吧。

###

索引量只是一个参考值,不是Site数据很正常,这样去理解就对了,不要去挖掘更深的东西,百度搜索引擎工程师多还没弄明白,你瞎着急什么啊。踏踏实实做站吧小伙子。

本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/23944.html