分享好友 资讯首页 频道列表

站长基础交流之搜索引擎收录网页的四个阶段

2017-12-08 00:211050
 作为SEO从业者,不仅要被搜索引擎抓取,还要被收录,最重要的是在收录后有良好的排名,本文将简单分析下搜索引擎收录网页的四个阶段。每个网站、每个网页的排名都是不一样的,看看你的网站处于哪个阶段呢?
 
网页收录第一阶段:大小通吃
搜索引擎的网页抓取都是采取「大小通吃」的策略,也就是把网页中能发现的链接逐一加入到待抓取URL中,机械性的将新抓取的网页中的URL提取出来,这种方式虽然比较古老,但效果很好,这就是为什么很多站长反应蜘蛛来访问了,但没有收录的原因,这仅仅是第一阶段。
网页收录第二阶段:网页评级
而第二阶段则是对网页的重要性进行评级,PageRank是一种著名的链接分析算法,可以用来衡量网页的重要性,很自然的,站长可以用PageRank的思路来对URL进行排序,这就是各位热衷的「发外链」,据一位朋友了解,在中国「发外链」这个市场每年有上亿元的规模。    
爬虫的目的就是去下载网页,但PageRank是个全局性算法,也就是当所有网页有下载完成后,其计算结果才是可靠的。对于中小网站来讲,服务器如果质量不好,如果在抓取过程中,只看到部分内容,在抓取阶段是无法获得可靠的PageRank得分。
网页收录第三阶段:OCIP策略
OPIC策略更像是PageRank算法的改进。在算法开始之前,每个网页都给予相同的「现金」,每当下载某个页面A后,A将自己的「现金」平均分给页面中包含的链接页面,把自己的「现金」清空。这就是为什么导出的链接越少,权重会越高的原因之一。
而对于待抓取的网页,会根据手头拥有的现金多少排序,优先下载现金最充裕的网页,OCIP大致与PageRank思路一致,区别在于:PageRank每次要迭代计算,而OCIP则不需要,所以计算速度远远快于PageRank,适合实时计算使用。这可能就是为什么很多网页会出现「秒收」的情况了。
网页收录第四阶段:大站优先策略
大站优先的思路很直接,以网站为单位来衡量网页的重要性,对于待抓取的URL队列中的网页,根据所述网站归类,如果哪个网站等待下载的页面最多,则优先下载这些链接。其本质思想是「倾向于优先下载大型网站URL」。因为大型网站往往包含更多的页面。鉴于大型网站往往是名站,其网页质量一般较高,所以这个思路虽然简单,但有一定依据。
实验表明这个算法虽然简单粗暴,但却能收录高质量网页,很有效果。这也是为什么许多网站的内容被转载后,大站却能排到你前面的最重要原因之一。
反对 0
举报 0
收藏 0
打赏 0
站长基础交流之商城网站如何做才能吸引客户
随着互联网时代的到来,很有热爱逛街的人们,已经放弃了到实体店进行购物,开始了他们非同寻常的购物体验,每天在各种购物商城上

0评论2017-12-20312

站长基础交流之网站运营技巧之如何吸引目标客户
很多处于创业初期的企业都会在网站运营时遇到许多问题,最重要的问题之一就是构建企业品牌知名度,而想要出名那就需要在市场中混

0评论2017-12-20289

站长基础交流之 网站关键词排名不上去的原因
1、网站方向定位问题。建设网站之前,首先要了解用户人群以及自己能够提供的服务,同时结合行业特点定制适合自己风格的网站类型; 

0评论2017-12-20340

站长基础交流之研究关键词的意义
研究关键词的意义主要在于以下几个方面:  一、保证关键词是有人搜索的  做SEO优化,其中最重要的就是选择适当的关键词,选

0评论2017-12-20303

站长基础交流之网站无效页面的表现形式
网站中哪些页面被称为无效页面?  一般来说,无效页面对用户来说,就是没有价值的页面,其主要特征为:  1、对搜素引擎来说没

0评论2017-12-20312

站长基础交流之如何识别网站的seo优化效果?
一、主要关键词排名,是否进首页。体现优化的精度。一般做好这个方面,是一个网站的优化的主要标准。  二、多少关键词进排名。

0评论2017-12-20291

站长经验说说之网站优化的时间怎么算的?
百度SEO优化关键词分为冷门关键词、一般关键词、一般偏热门关键词和热门关键词、超级热门。关键词竞争度越大排名到首页的时间越

0评论2017-12-20246

站长基础交流之网站排名助手优化网站结构
网站结构优化注意事项  1、为了减少链接深度,首页和频道页堆砌上千条链接地址,这种情况对于前期网站权重不是很高的前提下基

0评论2017-12-20237