自动迭代方案——行为序列异常检测项目B

antiplugin_sl_sh项目:

  1. 模型训练
  2. 外挂预测

1. 项目结构

1.1 Data模块

1.1.1 数据保存

Data Type Update Frequency Data Source Range
预测数据 每天 前一天数据
训练数据 每周五 37天前的周三开始,四周的数据采样

1.2 Training模块

1.2.1 迭代方案

Type Update Frequency Data Source Range
Sliding Window 每周五 初始与baseline相同,之后每次更新替换新一周的数据,即始终只包含 4 4 4周的数据

1.2.2 甘特图

Mon 17 Mon 24 Mon 31 Mon 07 Mon 14 Mon 21 data sampled in 4 weeks data sampled in 4 weeks data sampled in 4 weeks Sliding Window Auto-Iteration Schedule

1.2.3 模型保存

  • 模型目录命名规则:MODEL_DIR=${ds_start}_${ds_range}
Type Example
Sliding Window 20181219_28, 20181226_28, 20190102_28

1.3 Prediction模块

1.3.1 预测方案

Step Operation Description
1 样本获取 每天,获取前一天全天数据样本,保存至对应目录
2 模型预测 样本获取完毕后,馈入模型预测结果
3 关联画像 预测结果上传Hive,并关联画像表
4 结果上传 画像结果保存至MySQL

1.3.2 结果呈现

  • 画像结果
MySQL数据存储示例

2. 启动脚本

2.1 Crontab定时任务

# sanhuangua_train
50 15 * * 5 bash /home/zhoujialiang/nsh_sanhuan_sl_auto/train.sh >/home/zhoujialiang/cron_sanhuangua_train.log 2>&1

# sanhuangua_predict
20 20 * * * bash /home/zhoujialiang/nsh_sanhuan_sl_auto/predict_daily.sh >/home/zhoujialiang/cron_sanhuangua_predict.log 2>&1

2.2 Shell模块任务

2.2.1 train.sh

#!/usr/bin/env bash
# Usage_1: bash train.sh

# 工作目录
WORK_DIR=/home/zhoujialiang/online_sanhuan

# 定义参数
last_wednesday=`date -d "wednesday -2 weeks" +%Y%m%d`       # 过去最近的周三
ds_start_old=`date -d "$last_wednesday -35 days" +%Y%m%d`   # 旧模型的数据样本开始日期
ds_start=`date -d "$last_wednesday -28 days" +%Y%m%d`       # 新模型的数据样本开始日期
ds_start_new=`date -d "$last_wednesday -7 days" +%Y%m%d`    # 新模型需更新的数据样本开始日期


# 复制重复数据至新目录
echo /usr/bin/python3 $WORK_DIR/update_data.py pos --old_dir ${ds_start_old}_28 --ds_start <
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值