2008日志清理 server sql_DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析...

官方指导文档:https://help.aliyun.com/document_detail/68322.html

但是会遇到大家在分区上或者DataWorks调度参数配置问题,具体拿到真实的case模拟如下:

83694ddeebe624f3015308388300570b.png

创建数据源:

步骤1 进入数据集成,点击作业数据源,进入Tab页面。

e8967ea93ab593a68740634652a59d50.png

步骤2 点击右上角

新增数据源,选择消息队列 loghub。

205f47b39675a1bcacfc671b110b0e64.png
aecb18ba4dec2f941a0c68dcfad82b1c.png

步骤3 编辑LogHub数据源中的必填项,包括数据源名称、LogHub

Endpoint、Project、AK信息等,并点击 测试连通性。

55ed072601185cfd7e75ba668a320bc6.png

创建目标表:

步骤1 在左侧tab也中找到临时查询,并右键>新建ODPS SQL节点。

d5b0c56d74576ca30863ea76f8a34db2.png

步骤2 编写建表DDL。

步骤3 点击

执行 按钮进行创建目标表,分别为ods_client_operation_log、ods_vedio_server_log、ods_web_tracking_log。

步骤4 直到日志打印成本,表示三条DDL语句执行完毕。

3b7796ca790e8841e91dcd85c46b0d30.png

步骤5 可以通过desc 查看创建的表。

2210b5ddfae7dae4be83f97d3d5dd9dc.png

其他两张表也可以通过desc 进行查询。确认数据表的存在情况。

创建数据同步任务

数据源端以及在DataWorks中的数据源连通性都已经配置好,接下来就可以通过数据同步任务进行采集数据到MaxCompute上。

操作步骤

步骤1 点击

新建业务流程 并 确认提交,名称为 直播日志采集。

72414f95c00885ea6fb12b6016721207.png

步骤2 在业务流程开发面板中依次创建如下依赖并命名。

2e0da57f8c8264ccaeb61c5642bdc754.png

依次配置数据同步任务节点配置:web_tracking_log_syn、client_operation_log_syn、vedio_server_log_syn。

步骤3 双击

web_tracking_log_syn 进入节点配置,配置项包括数据源(数据来源和数据去向)、字段映射(源头表和目标表)、通道控制。

276da120e3f8cbba6046147f99a08591.png
39b6d341559368b29217d9d9e7a798bb.png

根据采集的时间窗口自定义参数为:

当然其消费点位也可以按照自定义设置5分钟调度一次,从00:00到23:59,startTime=

04e27f8955ac6c27899f7e1c160896c7.png

[yyyymmddhh24miss−10/24/60]系统前10分钟到endTime=[yyyymmddhh24miss-5/24/60]系统前5分钟时间(注意与上图消费数据定位不同),那么应该配置为ds=[yyyymmdd-5/24/60],hr=[hh24-5/24/60],min=[mi-5/24/60]。

步骤4 可以点击高级运行进行测试。

f943dce32494b6d6d4069dd0e416d2d2.png

可以分别手工收入自定义参数值进行测试。

e44e59e507380c85c65fdd180c116087.png

步骤3 使用SQL脚本确认是否数据已经写进来。如下图所示:

9070fd0f83e2c92ff72903b507dcb309.png

日志服务的日志正式的被采集入库,接下来就可以进行数据加工。

比如可以通过上述来统计热门房间、地域分布和卡顿率,如下所示:

13ac8ab4d47064e027d68f8af7fdcc81.png

具体SQL逻辑不在这里展开,可以根据具体业务需求来统计分析。依赖关系配置如上图所示。

作者:祎休

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值