陆拾肆- 时序数据的特征化

BerryBC

于 2022-12-10 18:05:29 发布

阅读量640

点赞数

分类专栏：三世书记录文章标签：人工智能大数据 bi 商务

本文链接：https://blog.csdn.net/BerryBC/article/details/128266724

版权

三世书记录专栏收录该内容

66 篇文章 4 订阅

订阅专栏

一、前期大数据状况

进行客户域大数据运营时，一般是在当前状态计算客户的行为特征。
如会建立特征为

近7天是否有登录
昨天是否有登录
近7天销售情况
点击主页后是否有点击下层页面
哪个页面点击购买
总浏览电子产品的次数占访问次数占比
不进行商品浏览，只进行游戏化活动访问次数占比
…

利用上述特征进行建模，对目前应该对哪些客户进行哪些操作（如推荐哪种商品、是否给与优惠折扣）的确是足够的，而且也是较为容易简单的

二、目前建模的客户的特征

对于当前对客户的操作运营，使用上述简单的办法是可以的
但对于商业模式的深入挖掘，简单的利用机器学习能力是不足够的，还必须考虑不同人群对公司商业模式的整体贡献以及针对人的运营。
例如例子：
客户行为

当我们占在某个时点去提取特征的时候，我们会很明显的对客户进行一个历史行为的缺漏
如上面的例子，如果针对促活的目的来看，我们很容易把这两个用户当作是同一类的人，这明显是会有误导的，可以看出客户 A是有频率的在游戏上进行游玩的

三、时序大数据的痛点

对于有时序数据，即使简单的把每天的数据，以及每天的行为进行特征化，也会生成非常大量的特征。
如对上述客户 A 来说，短短 32 天就会产生 32 * N 个特征（进行游戏、充值、购物、充值金额、购物金额等等）。如果考虑转化如图片等视觉机器学习 方式去进行，还需要考虑相邻特征之间的相关性。
甚至如果还考虑小时分钟的当天内的操作顺序，这个会更大。
这在以前简单的机器学习方式是接近不可能的任务，就更没必要讨论建模是选用有监督还是无监督了。