Step1 开发
在dev2上拉取gitlab上的代码进行开发,之后在工程根目录执行以下命令对引擎代码进行打包
make qmodule_get
make package
将packages目录下生成的压缩包上传到demo环境(var105),执行tar zxvf xxx
解压
注意
1.我们需要对version里面的版本加1
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pvu26fkA-1640769752345)(/Users/lijinze/Library/Application Support/typora-user-images/image-20211229162812458.png)]
2.tt_rec.online_zzzc.conf要添加两个地方的代码,一个是modules里添加策略对应的类名,一个是添加策略的配置。二者必须都需要添加
Step2 上线
cd到之前的线上版本路径,执行rm proc/status
,这样流量就不会到该机器上,cd到log路径执行tail -f xxx.log.main
,查看流量是否切换干净。退回到根目录,执行ln -snf 最新版本 软链接目录
,执行supervisorctl start xxx
,cd到log路径执行tail -f xxx.log.main
,查看召回引擎是否初始化成功,执行touch proc/status
,这样流量就会进到机器中。cd到log路径执行tail -f xxx.log.main
,查看是否有bug打印到log中,观察至少一分钟。
Step3 配置策略
以hdp-svideo-algo的权限登陆到var07上,cd到~/lijinze/projects/online_config中,将run.sh
以及conf_xx.new
按照上线需求修改并且执行,通过http://var01.rec.zzzc.qihoo.net:10085/qrec_manager/policyinfo?u=
查看var01上的策略是否生效,如果发现生效,查看var01的log看是否有bug,就是报错信息:Traceback (most recent call last):
,一般出现报错信息,推推上就会报警。
Step4 出现推推报警以及log报错我们该怎么做
首先不要着急,我们先将流量断掉,再停掉引擎服务,之后软链接到上一个版本,再开启服务,最后切流量,就这样一台机器就回滚到上一个版本了,其他机器也这么做。
Step5 如何查看我们的策略出了多少以及我们的策略最终的实时打点
如何查看我们的策略最终在用户设备上的打点呢?我们需要登陆varol10.rec.zzzc.qihoo.net
或者varol11.rec.zzzc.qihoo.net
这两者中的一个,vim一下/home/s/apps/CloudSearch/qrec_feedback_server/log/log.log
,因为youtu/zm/browser_main的打点都会落到这个日志里面,所以我们需要cat log.log | grep "yotu_zm" | grep "film_selected"
,这是一个例子,我们需要指定我们的引擎以及新上的策略名,只要日志中存在满足条件的记录,我们的策略就说明真正展示给了用户,我们的T+1报表就会记录下我们策略的指标,该记录也可以作为训练模型的离线数据进行模型迭代与训练。