简单APACHE日志分析的具体操作

Linux操作系统运维问题

简单APACHE日志分析的具体操作

发布日期：2015-12-18 20:12:43

　　1.获得访问前10位的ip地址

　　cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr|head -10

　　2.访问次数最多的文件或页面,取前10

　　cat access.log|awk '{print $11}'|sort|uniq -c|sort -nr|head -10

　　cat access.log|awk '{counts[$(11)]+=1}; END {for(url in counts) print counts[url], url}'

　　3.统计这个日志文件中所有流量

　　cat access.log |awk '{sum+=$10} END {print sum/1024/1024/1024 "G"}'

　　4.列出输出大于200000byte(约200kb)的exe文件及对应文件发生的次数

　　cat access.log |awk '($10 > 200000 && $7~/\.exe/){print $7}'|sort -n|uniq -c|sort -nr|head -100

　　5.如日志最后一列记录的是页面文件传输时间，则有列出到客户端最耗时的页面

　　cat access.log |awk '($7~/\.php/){print $NF " " $1 " " $4 " " $7}'|sort -nr|head -20

　　6.列出最耗时的页面(超过60秒的)的及对应页面发生的次数

　　cat access.log |awk '($NF > 60 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -20

　　7.列出传输时间超过30 秒的文件

　　cat access.log |awk '($NF > 30){print $7}'|sort -n|uniq -c|sort -nr|head -20

　　8.统计404的连接

　　awk '($9 ~/404/)' access.log | awk '{print $9,$7}' | sort |uniq -c

　　结果太多就看一下前10

　　awk '($9 ~/404/)' access.log | awk '{print $9,$7}' | sort |uniq -c |sort -nr | head -10

　　9. 统计http status.

　　cat access.log |awk '{print $9}'|sort|uniq -c|sort -rn

　　10.蜘蛛分析查看是哪些蜘蛛来访问过。

　　cat access.log |awk '{print $12}' | grep -iE 'bot|crawler|slurp|spider' |sort |uniq -c

　　查看正在来访的蜘蛛

相关问题		热门问题
Docker在云容器技术领衔 Flocker 0.3.1 新特性 Apache Flume 1.5.2 发布发展中的 Docker 技术 OpenStack私有云DR的益处 Seafile 3.1.11 发布 Docker1.3改动简介 Seafile Client 3.1.10 发... 语音输入四强争霸 Apache Libcloud 0.16.0 ...		Windows Server 2012 防火墙... Linux下l2tp客户端xl2tpd安装配置... 阿里云ECS关于跨服务器快照/镜像的使用说明 Linux系统下测试UDP端口是否正常监听的办... 阿里云ECS通过安全组屏蔽/拦截/阻断特定IP... 如何解决ECS Windows提示显示设置无法... 如何解决ECS服务器误开启了防火墙导致远程连接... 阿里云数据库安全阿里云ECS通过安全组实现将不同账号同地域云服... ECS云服务器的自定义镜像FAQ

业务QQ： 11611616 673768899 673768855		联系电话： 023-61066666 66887777 89082222
离线联系： 13452888882 13452888883 13452888886		备案专线： 023-60887777 备案专员QQ：673768866
联系地址：重庆市九龙坡区石桥铺一城精英国际40层17号 Copyright © 重庆典名科技有限公司 023dns.com All Rights Reserved