需求说明
今天到现在为止实战课程的访问量
从今天到现在为止从搜索引擎引流过来的实战课程访问量
互联网访问日志概述
为什么要记录用户访问日志
1)网站页面的访问量
2)网站的黏性
3)推荐
用户行为日志内容
用户行为日志分析的意义
网站的眼睛
网站的神经
网站的大脑
Python日志产生器开发之产生访问url和ip信息
使用Python脚本实时产生数据
Python实时日志产生器开发
新建 generate_log.py
#coding=UTF-8
import random
url_paths = [
"class/112.html",
"class/128.html",
"class/145.html",
"class/146.html",
"class/131.html",
"class/130.html",
"learn/821",
"course/list"
]
ip_slices = [132,156,124,10,29,167,143,187,30,46,55,63,72,87,98,168]
def sample_url():
return random.sample(url_paths,1)[0]
def generate_log(count = 10):
while count>=1:
query_log = "${url}".format(url=sample_url())
print query_log
count = count - 1
if __name__ == '__main__':
generate_log()
功能开发及本地运行
[hadoop@hadoop000 logs]$ tail -200f access.log
query_log = “{ip}\t{local_time}\t{url}\t{status_code}\t{referer}”.format(url=sample_url(),ip=sample_ip(),referer=sample_referer(),status_code=sample_status_code(),local_time=time_str)
linux crontab
网站: http://