浅谈百度如何收录我们的旅游线路(爬行篇)

  • 2013-12-26
  • 分类:旅行社经验分享
  • 阅读631
  • 评论0
写了好多东西,突然发现似乎还没有写过关于百度如何收录我们的旅游线路的文章,因为这一块主要是涉及到搜索引擎工作原理的知识,比较理论化一些,会有点难懂,但是别担心,接下来一刀会尽量将它描述得简单一些。

8cbf_b.jpg

我们先来想象一下一个游客搜索的场景:


“国庆前的一周,小明想要去厦门旅游,于是小明就坐在电脑前开始用百度搜索他想要的旅游信息,当他在百度搜索框输入“十一厦门三日游”后,眨眼的功夫,百度就给小明返回了无数他想要寻找的信息……”


大家有没有想过:百度是怎样在不到一秒钟的时间内,快速从几十万几百万,甚至几千万包含搜索词的页面中,找到最合理、最相关的一千个页面,并且按照相关性、权威性进行排序呢?


这表面最简单的过程,实际上牵扯了非常复杂的后台处理。搜索引擎(百度)的工作过程大致可以分成三个阶段:爬行、索引、排序。而小明的搜索过程则主要涉及到了排序阶段,前两个阶段在小明搜索前就已经早早地完成了。并且,这三个环节是紧紧相扣的:我们的线路网页只有被百度蜘蛛爬行到了,才会有可能被百度收录(注意:只是有可能);我们的线路只有被百度数据库收录了,才会有可能在百度获得比较好的排名(注意:也是只是有可能)。所以,如果前面一环没有实现的话,后面的环节也就无法实现。


下面将分成多个篇幅为大家介绍百度是如何收录我们的旅游线路的。


首先是爬行阶段!


那么,百度是如何爬到我们的旅游线路呢?


爬行,是搜索引擎(百度)工作的第一步,主要目的是发现新的网页内容。


因为互联网就像蜘蛛网似地四通八达,而百度那个负责寻觅网页的程序就像蜘蛛似地没日没夜的在互联网上爬来爬去,所以我们就很形象地将它称为百度蜘蛛。百度蜘蛛能够从一个网站爬到另一个网站、从一个网页爬到另一个网页,唯一的途径就是——链接!链接,既是从一个网站到另一个网站的通道,也是从一个页面到另一个页面的通道。什么是链接请点击阅读:http://www.cncn.net/blog/6570


比如,你朋友的网站上有一个链接向你的网站的一个链接,那么就相当于是有一个从外部来到你网站的通道,百度蜘蛛在你朋友的网站上爬行的时候,就会通过这个链接爬进你的网站里来,然后在你的网站里通过站内的内部链接爬行更多的页面。如果你的网站有很多外链的话,也就等同于有更多进入你网站的入口,那么百度蜘蛛爬进你网站的次数也就多,这就会很有利于百度蜘蛛在你的网站内发现你新发布的内容。


当然了,外链并不见得非得是指向网站的首页,也可以直接指向你的内页(线路页面),这样百度蜘蛛就可以沿着外链直接爬到你的线路页面上来,这就是我们为什么要去给具体的线路页面做外链的原因。但是大部分的情况下,一个网站或网店都是首页的外链数量比较多,所以首页被爬行的次数也就最多,进而快照更新也快、权重也高!而内页则相差很大!


沿着链接,从一个网站到另一个网站、从一个网页到另一个网页,既爬行新的页面,也爬行旧的页面,百度蜘蛛就是这样实现了爬行的过程。在这个过程中当然还有更多更细的知识点,但是对于我们来说,只需要知道百度蜘蛛是通过链接在网页间爬来爬去的就足够了!


但是,网页被百度蜘蛛爬行了,并不表示该网页就被百度收录了,能否被收录,则要看索引阶段!

发表评论

匿名匿名

提示:请先登录再进行评论,