首页 > 问答 > 什么是有效收录,如何辨别收录的内容是否有效?

什么是有效收录,如何辨别收录的内容是否有效?

[导读]:关于本问题想更好的理解,建议先看下下面两个内容: 关于百度对每个网站的资源配额问题 参加2014百度站长平台广州沙龙有感 第一个是我之前提出的,针对那些搜索量很低或...

关于本问题想更好的理解,建议先看下下面两个内容:

关于百度对每个网站的资源配额问题
参加2014百度站长平台广州沙龙有感

第一个是我之前提出的,针对那些搜索量很低或者几乎没有人去搜索的文章是否有存在的必要性,也就是下面@郑述超[?] 讲的上次广州百度站长大会提出的有效收录的问题。

所以,现在可以认定,相对于有效收录来讲,那些无效收录不但不能提高网站的权重,还会对网站的搜索引擎质量认定以及网站内容抓取上有很大影响。

那么,问题来了,什么样的文章才算是有效收录或无效收录?怎么去判断和区分?

假设:

A:一篇文章从发布-→收录,一年内几乎没有人去搜索这个文章的主题和相关的关键词。比如那些单独为搜索引擎创造的垃圾文章,标题什么意义都没有。

B:一篇文章从发布-→收录,因为标题中含有的关键词竞争热度比较大,以及除了主词之外,没有很准确的扩展词,所以被检索的系数很低很低。比如《听了马云的演讲,我学到了很多知识》。

C:一篇文章从发布-→收录,因为标题中含有的关键词搜索指数很低很低,一个月甚至一年被检索和点击的次数都特别有限,比如《星期天,我和妈妈逛商场》。

那么上面三种哪一种或多种算是无效收录?
以下图片来自广州百度站长大会官方PPT截图:



###

百度优先建重要库的原则
Baiduspider抓了多少页面并不是最重要的,重要的是有多少页面被建索引库,即我们常说的“建库”。众所周知,搜索引擎的索引库是分层级的,优质的网页会被分配到重要索引库,普通网页会待在普通库,再差一些的网页会被分配到低级库去当补充材料。目前60%的检索需求只调用重要索引库即可满足,这也就解释了为什么有些网站的收录量超高流量却一直不理想。
那么,哪些网页可以进入优质索引库呢。其实总的原则就是一个:对用户的价值。包括却不仅于:
1,有时效性且有价值的页面:在这里,时效性和价值是并列关系,缺一不可。有些站点为了产生时效性内容页面做了大量采集工作,产生了一堆无价值面页,也是百度不愿看到的.
2,内容优质的专题页面:专题页面的内容不一定完全是原创的,即可以很好地把各方内容整合在一起,或者增加一些新鲜的内容,比如观点和评论,给用户更丰富全面的内容。
3,高价值原创内容页面:百度把原创定义为花费一定成本、大量经验积累提取后形成的文章。千万不要再问我们伪原创是不是原创。
4,重要个人页面:这里仅举一个例子,科比在新浪微博开户了,需要他不经常更新,但对于百度来说,它仍然是一个极重要的页面。

###

无效收录的定义必须有个参考对象。
1.百度收录即通过百度审核后放出的页面,对百度而言是有效的。
2.标题或者内容搜索人少,对用户而言是无效的。
3.夫唯上面提到搜索产生的垃圾页面,依旧对百度是有效的,但对用户是无效的;

综上所述,收录的有效性参考对象是以用户的搜索浏览为准。

###

个人理解:
无效收录=无搜索量(少),无潜在用户群,无展现。

###

我觉得有效手里就是进入了百度索引库的。
无效收录就是无任何搜索价值,连一个索引库都进不去的,这种页面对于百度来说可能价值就不大, 因为除了占用各种资源外(存储资源、更新页面所需的宽带资源、分析页面所耗费的计算资源),好像起不到什么作用。

另外:有关键词价值的页面也不一定可以进入索引库的,毕竟一个索引库中的页面是有限的。

###

理了下思路:
我认为,这次“有效收录”的说法是,针对过往百度几次算法的总结说明。
包括:
1.重复内容(低质量)
2.利用与站点无关的热词引流
3.制作低质量静态搜索结果页或Tag标签页
4.不相关静态搜索结果页
以上几点的共同特点是,可能被百度收录了、但没有解决用户问题、或者网站主题内容不符等。

网站内容应该以建设“核心页面”为主:
比如,
b2c网站,应该以提供产品购买等信息服务为核心;
视频网站,以提供在线视频观看浏览为核心;
资源下载站,以提供资源在线下载为主;
seo网站,以提供seo相关知识为核心。
(欢迎大家补充,顺便思考下自己网站的“核心”)

收录不代表展现,展现不代表有(排名)流量、有流量不代表有转化。

###

B:一篇文章从发布-→收录,因为标题中含有的关键词竞争热度比较大,以及除了主词之外,没有很准确的扩展词,所以被检索的系数很低很低。比如《听了马云的演讲,我学到了很多知识》。

C:一篇文章从发布-→收录,因为标题中含有的关键词搜索指数很低很低,一个月甚至一年被检索和点击的次数都特别有限,比如《星期天,我和妈妈逛商场》。

这两个举例应该算到有效收录里面, 我猜如果是百度官方人员回复。会搬出 原创 这块来回复

至于无效收录,我赞同夫唯老师的回复。
至于原创这个东西,王淘都说了这个东西判断很麻烦。。。

###

如果按搜索量和排名来算有效收录和无效收录,那不懂SEO的网站编辑其不是在源源不断制造无效收录,给网站带来负能量。
无效收录,应该算:
1、同一个内容,多个URL;
2、过分聚合产生的无实际价值的页面;比如搜索结果的聚合。
3、由用户使用痕迹或查询产生的页面。

###

个人认为:什么样的网站、就要有相关的内容、切有相关的用户群体,切能给这部分群体提供价值,这就算有效收录。(之前群里讨论的几句原话)

###

我倒是比较关心有效收录和无效收录会不会相互转变,比如无效收录会不会变成有效收录,这个问题可以问下百度。另外上边的回答都偏向文章的标题,我想评价一个文章是不是无效收录,内容比标题重要。

###

“所谓有效收录就是指带来流量的页面,如果带来流量的页面占总页面的比例过低,是非常危险的”——引自《参加2014百度站长平台广州沙龙有感》第五点。“比例过低”的标准在哪里?
如果文章确实带来了流量,但是停留时间非常非常短,跳失率为100%。那么这算有效收录吗?

###

好文章,学习了!

###

学习了,讨论更精彩

###

学习了!

###

我认为 无效收录是越少越好,



本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/ask/35430.html