【若泽大数据高级第二天】-- 基于Hadoop生态离线项目--日志分析

相关知识点

相关知识点

通用离线处理架构

通用离线处理架构

企业级项目开发流程

  • 项目调研:以业务为导向
  • 需求分析:要做什么,做成什么样

准备数据

  • 日志内容我是基于python3.x版本造了10w条数据
import time
import random

def create_time():
    '''
    获取一个随机时间
    '''
    a1=(2019,3,1,0,0,0,0,0,0)              #设置开始日期时间元组(1976-01-01 00:00:00)
    b1=(2019,3,23,0,0,0,0,0,0)              #设置开始日期时间元组(1976-01-01 00:00:00)
    start=time.mktime(a1)    #生成开始时间戳
    end=time.mktime(b1)      #生成结束时间戳
    random_time=random.randint(start,end)   #随机获取一个时间戳
    data_touple = time.localtime(random_time)   #转换成时间元组
    date = time.strftime("%F %T",data_touple)   #将时间元组转成格式化字符串(2019-03-22 02:02:42)
    return date

def create_traffic_num():
    '''
    获取100-99999之间的随机整数
    '''
    num=random.randint(100,99999)
    return num

def create_ip_num():
    '''
    获取1-255之间的随机整数
    '''
    num=random.randint(1,255)
    return num
    
def create_ip():
    '''
    随机生成IP地址
    '''
    ip = str(create_ip_num()) + '.' + str(create_ip_num()) + '.' + str(create_ip_num()) + '.' + str(create_ip_num())
    return ip
    
if  __name__ == "__main__":
    create_log_num=100000
    cnd='baidu'
    region='CN'
    level='E'
    domain='www.itoceanblog.com'
    for i in range(create_log_num):
        out_time=create_time()
        out_ip=create_ip()
        traffic=create_traffic_num()
        data_url = f"http://www.itoceanblog.com/post/{create_ip_num()}/"
        with open('itoceanblog.log','a',encoding='utf-8') as fa:
            data_out_str = f"{cnd}\t{region}\t{level}\t{out_time}\t{out_ip}\t{domain}\t{data_url}\t{traffic}\n"
            fa.write(data_out_str)
            fa.close()
全能云解析3.8 【3.7正式版 可以直接覆盖升级,其他版本 请重新安装!】 安装须知: 主目录文件结构及说明:(备注:调用方式前面皆省略了解析域名,浏览器访问时请添加在前面) 文件: * index.php 首页文件, 调用方式:"/?v=视频链接或视频名称"或"/?url=视频链接" * v.php 简洁调用接口,仅加载视频,不显示列表等信息,调用方式:"/v.php?url=视频地址"。 api.php 接口文件, 输出json数据供js使用。 play.html 框架调用文件,调用方式:"/play.html?url=URL地址" so.html 搜索页 404.html 404页 favicon.ico 网站图标 crossdomain.xml SWF文件跨域访问控制文件 注意:文件直接拷贝到网站根目录下,很重要; 目录: * admin 后台管理目录,为了安全请改名 video API模块目录 save 数据保存目录,注意:权限必须为755以上,不然无法后台更新配置; cache 文件缓存 目录 注意:权限必须为755以上,不然无法正常工作; include 引用文件 目录 player 播放器目录 plus 插件存放目录 source 资源目录 templets 模版目录 前台访问: "/?v=视频链接或视频名称" 一般不用设置即可正常工作,如果基本设置里的网站目录显示不正确,请手动修改,后面需要加"/" 注意:x3.7以后的版本,第一次安装需要先进后台恢复下配置才能使用! 注意: 升级完成后请务必清空缓存,包括浏览器缓存和视频缓存; 2019.3.24更新 * 修复v.php调用失败的bug; * 优化播放调用,修复若干bug; * 异常处理优化,使用fundebug插件收集异常信息; * 播放器优化,发生异常会调用H5播放器解决兼容问题; * 播放设置-线路设置 添加线路切换提示信息及显示时长设置; * 修复特殊格式视频无法播放的BUG; * 修复大部分已知BUG,其他细节优化; * 修复上个版本视频卡顿的问题; * 优化播放器调用,现在url参数无需加密调用; * 优化微信插件,修复BUG; 2019.3.19更新 * 修复无法设置默认解析的bug; * 修复视频可能有黑边的的bug; * 修复ckplayer播放器p2p信息设置无效的bug; *ckplayerx 控制栏添加上下集和选集按钮; * 配置代码优化,无配置文件可用默认帐号登录恢复配置,以后升级版本将不带配置文件可直接覆盖升级; * 播放器优化,主要是ckplayerx和dplayer,独立出官方集成p2p版本并升级到最新版本; * 链接跳转现在支持输入视频标题,可以实现链接到资源站的直接搜索; * 其他细节优化; 2019-3-13 * 防火墙代码优化,新添加版权保护,框架访问,API保护等规则; * 播放设置优化,Dplayer播放器添加弹幕,logo等设置; * 修复无法播放mp4的问题; * 修复自定义播放器无法使用的问题; * 修复硬盘缓存有效期与设置不符的BUG; * 优化核心代码,避免核心文件被误杀; * 优化搜索页面,优化记忆播放; * 默认资源优化,全部采用https资源; * 直播代码优化,添加m3u8跨域访问方法; * 后台播放器设置添加P2P信息开关和记忆播放开关; * 后台-播放设置-其它设置 添加解析调用提示设置,设置后会覆盖解析显示2秒后隐藏; * 搜索页面美化,添加支持输入视频地址; * 播放器添加记忆播放的功能; * 添加对乐多资源的直接解析; * 修复已知BUG,其他细节优化; * 搜索页面美化,修复BUG; * 修复手机端在开启公告后不能选集的BUG; * 修复自定义播放器无法保存的BUG; * 模版byg配置项添加设置LOGO,默认隐藏; * 播放设置添加服务器报错开关,经常提示报错可以关闭; * 其他细节优化; * 搜索页面美化,加入运行时间; * 云播放添加来源标签转换; * 播放设置添加解析开关; *修复域名黑名单获取来源失败时不拦截的bug; * dplayerx 添加 p2p 连接信息; * 云播放加入P2P加速支持, 设置路径:基本设置-播放设置-播放器设置-其他设置; * CMS解析插件加入对赞片的支持,感谢会员家乡味提供的代码; * 搜索页面-手机端优化; * 报错提示优化,加入反馈功能; * 云播放算法优化; * 搜索页面美化; * 后台-云播放设置 优化来源过滤; * 修复云规则版本信息不更新的bug; * 后台-云播设置, 添加资源标题及来源过滤; * 后台-播放设置-其他设置, 添加云播标题设置,用于修改线路切换里云播放的显示名称; * 解析线路及云播资源站设置添加显示名称支持; * 配置文件敏感项加密存储,保证数据安全;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值