GoAccess进行网站日志分析的最新教程

GoAccess是一个开源且免费的网站日志分析和交互式WEB日志查看器,可在 *nix 系统的终端中或通过浏览器运行。使用它可让系统管理员视化的查看统计报告,这对于SEO以及运维来说非常有价值。

本教程使用的环境为:CentOS 7.9 系统、Nginx服务器、GoAccess v1.5.6

GoAccess支持几乎所有Web 日志格式,包含:Apache、Nginx、Amazon S3、Elastic Load Balancing、CloudFront、Caddy 等

先安装依赖项

GoAccess可以仅依赖ncurses(CentOS一般默认安装了)。

另外可选依赖项有:libmaxminddb、openssl、GeoIP等,其中libmaxminddb与GeoIP仅任选其一,推荐选择前者。

CentOS安装ncurses

如果已安装请跳过此步骤。

yum install ncurses-devel

CentOS安装libmaxminddb

yum install libmaxminddb-devel

CentOS中openssl一般也会默认安装,可以使用openssl version命令查看其版本号。

安装GoAccess

wget https://tar.goaccess.io/goaccess-1.5.6.tar.gz
tar -xzvf goaccess-1.5.6.tar.gz
cd goaccess-1.5.6/
./configure --enable-utf8 --enable-geoip=mmdb
make
make install

在安装过程中如果提示“Missing development files for libmaxminddb library”这个错误,说明libmaxminddb未安装成功,请返回上文先确保成功安装。

使用GoAccess进行网站日志分析

GoAccess网站日志分析 – 终端仪表板

输入以下命令即可:

goaccess /www/wwwlogs/access.log

注意改成自己的日志文件名和路径。

接下来进行网站日志格式设置:

GoAccess 日志格式设置
GoAccess 日志格式设置

如果是Nginx或Apache主机的话,选择第一项,然后回车继续

GoAccess 网站日志分析演示
GoAccess 网站日志分析演示

可以用数字来选择需要详细查看的项目,例如查看搜索引擎爬虫情况,可以按数字键7,选择浏览器项目中的Crawlers(爬虫),然后回车,则可以查看详细清单,如下图:

GoAccess 网站日志分析爬虫情况
GoAccess 网站日志分析爬虫情况

GoAccess网站日志分析 – WEB浏览

GoAccess是支持输出HTML文件的,所以不习惯或者不方便使用仪表板的用户,可以通过浏览HTML文件来进行网站日志分析。

首先在网站中创建一个weblog目录用于存储HTML文件。

然后在终端中运行以下两行命令:

LANG="zh_CN.UTF-8"
goaccess /www/wwwlogs/access.log -o /data/wwwroot/weblog/index.html --log-format=COMBINED

浏览器访问网站/weblog/index.html就能查看网站日志分析了。演示:

GoAccess WEB方式查看网站日志分析演示
GoAccess WEB方式查看网站日志分析演示

自动刷新日志分析HTML

还可以通过计划任务的方式自动刷新日志,以宝塔面板为例:

宝塔面板计划任务:GoAccess自动刷新日志HTML
宝塔面板计划任务:GoAccess自动刷新日志HTML

执行周期可以根据需要自行调整!

非宝塔用户需要先创建一个脚本goaccess.sh:

#cat /www/goaccess.sh
#!/bin/bash
LANG="zh_CN.UTF-8"
goaccess /www/wwwlogs/access.log -o /data/wwwroot/weblog/index.html --log-format=COMBINED

最后将脚本加入到crontab中:

#crontab -l
0 * * * * /bin/bash /www/goaccess.sh

更多GoAccess功能请参阅手册:https://goaccess.io/man

站长帮社区

建站技术交流社区,欢迎提问与交流,还有大量WordPress主题与插件。

发表评论