快手用户活跃度预测

整体模型架构

import pandas as pd  导入pandas模块,并简写为pd

pandas : py数据分析模块(库名),用于数据分析和数据处理

pd : 缩写后的库名

from deep_tools import f 从deep_tools模块中导入f

from...import......(模块名)导入...(工具名)

文件夹

app_launch_log:用户登陆数据集

user_register_log:用户注册数据集

user_create_log:用户视频创建数据集

user_activity_log:用户行为数据集(点赞、转发...)

读取4份文件:

read_csv()函数:不仅可以读取csv文件,还可以直接读入txt文件(默认逗号间隔内容的txt文件)

上述图片中sep=’\t’表明规定用换行符分隔

p.s.拿到的数据最大序列长度是30天(用户注册日期不同)

目标预测未来一个周期,(e.g.根据第1-7天的行为预测第14天)

构建用户特征序列

以表格形式输出注册日志:

head()函数:

e.g.register.head()中:register是文件名,()中没有内容,默认输出5行

输出启动日志:

e.g.上图中id为330986的用户在4,9,11,12天都启动了该APP

输出创建日志:

输出行为日志:

用户特征序列提取方法

31-register_day:31是一个月,register_day是注册的日期,所以seq_length代表用户从注册到一个月的天数。

queue:队列

建立30个队列,把对应持续时间的用户放到一个序列里

用for遍历register数据

row[-1]代表最后一列,也就是seq_length。row[0]是第一列,也就是user_id

.append()函数:向列表末尾添加一个元素,这个语句的意思也就是把相应的user_id添加到user_queue中。

生成特征序列汇总表

get_array()函数:返回array的结果。

第8行self.seq_length,n_features:下附numpy.zero()函数用法

第13行pos(position)位置,即第几天进行注册的,下一行int(pos)-register_day是持续时间。创建第一个特征,把它传到对应特征的位置

所以这行代码的意思是把用户持续时间内的每一天都列为一行,特征数为列(用0填充)

也就是对每个用户都构建一个特征矩阵。

get_label()函数:先构建有(持续时间)个长度的label序列,都赋值成None,

for循环遍历最近7天,如果1-8特征内有‘1’(即用户有行为产生),就把对应天数的标签值置为1,判定该用户为活跃用户。

n_features=12表明每个用户每天都要统计这12项特征

for index,row in register.iterrows():iterrows()是pandas中的一种遍历方法

用for循环遍历register的行列,index是每一行数据的索引,row是一个Series对象,表示该行数据

第1行表示把launch设成1

.agg():聚合操作

groupby()函数用法如下:

2,3行重新指定了列名,

table中的day转换成str形式,后面加上:来分隔,后面再加上value(值)

row[0]是user_id,put_feature()函数在上面有定义,()中1代表第一个特征,row[1]为填充进去的内容(string)。没有填充的地方不变,还是0。

for循环构建6种不同特征(e.g.点赞,转发,拉黑...)

第4行act=record_to_sequence(act)是将act转换成序列

row[0]是user_id

i起始位置是0,i+3是3

groupby()函数用法如下:

只列举了一个行为特征,(要想知道一共有几个特征,直接value_count,)

第3行activity数据集里author_id(作者id)!=user_id(用户id)意思是观看别人作品,

进行merge操作取得交集(watched(观看)和 观看别人作品 的交集),运行完watched就是观看别人作品的信息

存到10这个位置

到此,12个特征就全部构建完成,这个矩阵是为了RUN网络进行服务的。

制作数据标签

活跃用户定义为7天内使用过APP(在上述任一类型日志中出现过)

label函数在上文提到过(label是一个序列),array[ ]内是按天数排序(第1天,第2天)并将每天的特征展开,1是有行为,0是无行为。

get_array()函数:上文中提到过,即输出array。

网络训练模块

在deep_tools文件里都已经封装好以上模块

构建RNN网络模型

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: captchatoken是快手应用中使用的验证token。当用户快手进行某些高级操作(如发布视频,点赞评论等)时,快手系统会要求用户进行身份验证,以确定用户是真正的人类而非机器人。而captchatoken就是快手用来验证用户身份的一种工具。 具体来说,captchatoken是由快手服务器生成的一串随机字符串,由系统随机分配给用户。在用户需要进行身份验证的时候,快手会提示用户输入captchatoken,用来验证用户的真实身份。如果用户输入的captchatoken与快手系统生成的相符合,则验证通过,用户便可以进行所需操作。否则,用户将被认定为机器人或非法行为者,可能会受到相应的惩罚。因此,captchatoken在快手应用中起到了非常重要的身份验证作用。 总之,captchatoken是快手应用中一种很重要的身份验证工具,用于确定用户的真实身份并防止机器人或非法行为者的入侵。 ### 回答2: captchatoken 是快手视频平台为了对抗恶意操作和机器人攻击所采用的一种验证码机制。该机制通过要求用户输入一组图形或文字验证码,来识别是否为真实用户,以保证快手用户体验和内容质。 对于快手这样的社交平台,其用户活跃度和内容质对于平台的发展至关重要。而遭受恶意攻击和机器人操作的平台,则会影响用户体验和平台形象。因此,快手采用了 captcha 机制,以识别是否为真实用户。 在快手平台上,用户在进行上传、评论等操作时,系统会随机产生一组验证码,并要求用户正确输入。当用户成功输入验证码后,才可以继续进行操作。而机器人等恶意攻击,则很难模拟正确输入验证码的过程,因为机器人不具备人类识别和反应的能力。 captchatoken 的采用,显然提高了快手的安全性和可信度,让平台能够更好地保护用户隐私和原创内容。当然,在一定程度上,这些验证码也给用户带来了一定的操作难度和不便,但这种牺牲是值得的,因为平台安全性和用户信任度的提升,终将使得快手用户群体更加庞大和活跃。 总之,captchatoken 对于快手来说,具有重要的作用,保护了快手平台的合法用户,防止了恶意攻击和机器人入侵,保证了快手平台良好的用户体验和内容质。 ### 回答3: captchatoken 是快手平台上为了防止机器人恶意攻击而推出的一种验证方式,类似于其他网站上的验证码,旨在确保用户的资料和数据安全。 快手是一款大众喜爱的视频社交应用,以其快速流畅的视频播放、热门内容的推荐和丰富的社交互动功能而闻名。但同时,快手平台也遭受了不少机器人或黑客等假用户的攻击,这些人使用自动化脚本等软件对用户账号进行非法操作甚至盗取用户数据、隐私等。因此,为了保护平台中的真实用户以及用户所上传的内容和数据,快手推出了 captchatoken 验证系统。 captchatoken 是一种由快手平台开发的一种人机验证系统,其原理是在用户进行登录、注册、修改密码或者特定流程操作时,要求用户输入一串字母或数字等组成的验证码,以证明该用户完全是人类而不是机器人。这种验证方式可有效防止机器人攻击或恶意注册,并确保快手平台上的多个功能和信息的真实性。 captchatoken 的使用,符合快手平台提高用户数据安全和信息保密的统筹战略。对企业而言,通过运用 captchatoken 进行注册、登录和验证等,可以更好地保障精准营销,为企业获取更精准且实际的用户数据。同时,这也提高了用户在平台的使用体验,降低了用户的投诉和退订率,使平台上的内容和使用环境更加安全可靠。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值