功能测试
深圳SEO悦鹜博客首页 > SEO > 正文

从网站日志分析收录快照不及时的原因

发布-YUEWU.ORG | 查看- | 发表时间-2012/9/9

    收录和快照更新不及时是很多站长遇到过的,且是相当头疼的一个问题,网站优化的最直接目的可以说就是提升网站权重和关键词排名,如果快照不更新,收录不及时,这些都是浮云。深圳SEO悦鹜在这里介绍一下通过网站日志来分析网站收录和快照不更新的原因。

对于网站日志的分析,可以参考[通过网站日志分析蜘蛛来访情况],这里不再多讲。主要是看看搜索引擎蜘蛛来访情况及抓取情况。

一、蜘蛛来访情况

对于网站收录快照不更新,首先要看蜘蛛是否来访,如果根本来有蜘蛛到访,当然谈不上更新了。解决蜘蛛来访少的问题可以通过多建立外部链接来解决,可以考虑网站内容更新之后,立即去一些高权重的平台,如论坛,博客等,发布文章或者目录的链接,吸引蜘蛛抓取。此外就是内部锚文本,给网站的每个网页尽可能多的蜘蛛抓取入口,让网页抓取量尽可能的提高。

二、抓取页面

看看蜘蛛主要抓取的页面和目录有哪些,一般正常情况下文章内容目录应该是抓取量最大的,如果前面一文提到的悦鹜博客,post目录和art目录是抓取最多的。如果不是这样的话,说明内容目录抓取的力度不够,比如大量抓取的是无关紧要的目录和内容,甚至是后台的一些目录,当然效果就不好了。

针对这种情况,可以引导蜘蛛更多的抓取文章内容目录下面的网页,如针对更新的页面创造更多的链接入口,其中包括站内的互相链接导入站外的外链发布;对于一些更新比较少或根本不再有更新的目录,可以考虑先将目录屏蔽掉,让权重和蜘蛛更多的导入进内容更新频繁和量大的栏目;等等。

运用robots.txt或者Nofollow标签,对于网站不重要的目录或者页面,以及后台的一些文件进行限制。

三、抓取页面返回状态

蜘蛛停留时间比较多,但是抓取量不算特别多,需要查看百度蜘蛛抓取页面返回的状态码200304404所占比例。如果304比较多,那么是否考虑将这些蜘蛛资源进行合理的分配到未抓取的页面。如果404页面比较多,那就要考虑蜘蛛是不是被带进一些陷阱里面,检查网站内部造成404状态码的页面,并加以改正。

更多

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章
最近评论
访客留言
版权所有 Copyright(C)2011-2017 悦鹜博客 | 深圳SEO | 网站优化 | SEO入门笔记