python网站访问日志分析_python实现apahce网站日志分析示例

#coding:utf-8

#!/usr/bin/python

'''

程序说明:apache access.log日志分析

分析访问网站IP 来源情况

日期:2014-01-06 17:01

author:gyh9711

程序说明:应用到:shell与python数据交互、数据抓取,编码转换

'''

import os

import json

import httplib

import codecs

LogFile='/var/log/apache2/access.log'

#日志

logMess='/tmp/acc.log'

if os.path.isfile(logMess):

os.system('cp /dev/null %s'% logMess)

file=codecs.open(logMess,'w+',encoding='utf-8')

def cmd(cmd):

return os.popen(cmd).readlines()

'''

def getIp(ip):

return json.loads(os.popen("/usr/bin/curl http://ip.taobao.com/service/getIpInfo.php?ip=%s" % ip).readline())['data']

'''

conn = httplib.HTTPConnection('ip.taobao.com')

def getIpCountry(ip):

conn.request('GET','/service/getIpInfo.php?ip=%s' % ip)

r1=conn.getresponse()

if r1.status == 200:

return json.loads(r1.read())['data']

else:

return "Error"

#将access.log文件进行分析,并转为python数组

file.write(u"字段说明:ip   访问次数据  ip国家 城市的 isp号  省份  所在地区\n")

ipDb=[]

for i in cmd('''/usr/bin/awk '{print $1}' %s |sort |uniq -c''' % LogFile):

ip = i.strip().split(' ')

ipDb.append(ip)

#通过taobao 提供接口分析ip地址来源

for i in ipDb:

_tmpD=getIpCountry(i[1])

#格式说明:ip   访问次数据  ip国家 城市的 isp号  省份  所在地区

out="%s%s%s%s%s%s%s"%(i[1].ljust(20),i[0].ljust(10),_tmpD['country'].ljust(20),_tmpD['city'].ljust(16),_tmpD['isp_id'].ljust(16),_tmpD['region'].ljust(16),_tmpD['area'].ljust(16))

print out

file.write("%s\n"%out)

conn.close()

file.close()

'''

'''

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值