经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
站长资讯

2016年最新网站日志分析及分析工具宝典

作者:habao 来源: 日期:2018-1-26 12:38:16 人气:

  不少新手在做网站优化的时候,总是只盯着站内优化和外链,然而优化的效果并不显著,大家往往会忽略另一个十分重要的数据分析,那就是网站日志的分析。

  网站日志的数据不同于统计数据,统计数据可以看出每天网站的访问量、来源与访问时长等相关数据,这些数据的分析必不可少,但同样网站日志里面的数据分析也必不可少。今天小编盛淇seo跟大家分享一下。

  首先我们了解一下网站日志在那个地方可以找到,就以本站举个例子,本站使用的是万网的服务器,网站日志的以及下载请看下图:

  其他空间服务商的网站日志存在的名称可能不同,不过几乎都是大同小异,实在没找到可以直接联系空间商。

  网站日志一般都以天为单位作为一个文件,如上图下载的就是今天的日志,2016-7-22的日志,当然因为今天还没有过完,所以统计的数据只统计到小编点击下载的那一刻,所以一般都分析昨天的网站日志。

  查看网站日志的方法有很多,由于下载的是txt文件,直接打开查看或者用Excel表格打开也是可以的,但不这样做,因为数据太多,分析无从下手。

  所以小编盛淇seo推荐大家常用的网站日志分析工具进行分析,推荐的工具包括爱站工具包里面的日志分析工具以及金花站长工具里面的日志分析工具,今天给大家介绍的就是金花站长工具,因为小编亲测使用过,认为较好使用。

  4.日志文件夹的默认径是桌面,也就是说你下载的日志如果是在桌面放在,直接点击分析日志按钮即可,如果不是那就点击选择文件。ps:按钮选择目录是可以批量分析日志的,即同一个文件夹里面的所有日志。

  5.打开所要分析的日志之后,我们主要看三项数据:百度蜘蛛来访页面和次数、404错误页和来访IP、其他错误及来访IP

  6.分析百度蜘蛛来访数据分析(如下图),一般蜘蛛都有之分,如果手动一个个IP用nslookup命令去区分,工作量就有点大了,所以我们可以点击删除虚假的按钮,把假蜘蛛全部去掉,留下的便是真正百度蜘蛛的来访数据。

  7.404错误页分析(如下图),404页面可以帮助我们轻易找出网站的死链接,同时还有一点,就是找出对网站的恶意访问者,包括有人尝试用各种径试图登录网站后台或者进行Sql注入,从而控制我们的网站,对于这样的IP,小编二话不说就会屏蔽该IP的访问,如图中的121.42.0.82这个IP,给我网站制造了大量的404页面。

  8.其他错误分析(如下图),在404页面分析出的恶意IP如无意外就会第二天的其他错误里面看到它,因为已经它们的恶意访问,所以出现的是403状态码。

  2、在爬虫一定的抓取时间内,尽量少花精力放在一些无用的噪音页面上(重复页面,低质量页面,空内容页面,404页面,不排名页面,低页面等);

  7、日志中不要有太多的404,不要有无理由的跳转,不要有很多的500(服务器错误),这样的情况出现;

  12、爬虫可以根据我们入口的调整,robots.txt的引导,JS的设计等按照我们的要求进行爬取;

  13、爬虫越多越好。。。对我们的兴趣越大越好,当然,一切是在我们自身信任度和重要度增加的基础上。