Flink 统计页面点击量

本文介绍了如何使用Flink实现实时统计页面广告点击量,按省份划分并过滤恶意点击用户。通过创建时间窗口,对用户行为日志进行处理,统计每小时各省份广告点击量,并在5秒内更新。同时,当用户点击次数超过设定阈值时,将其加入黑名单并通过侧输出流告警。
摘要由CSDN通过智能技术生成

前言

在一些大型的电商网站上,对于产品经理或线上推广的营销人员来说,经常需要对页面的点击量进行分析统计,从而为页面的广告投放做更精确的数据支撑;

在实际的业务场景中,大致是这样的一个流程,页面先做用户行为的日志数据埋点,然后由实时或准实时应用将行为数据经过ETL落盘(HDFS或大数据存储引擎),之后再由下游应用对这些行为日志的数据根据业务指标进行统计分析,输出并展示成相关的大屏或报表;

如下,为一个经过ETL之后的页面点击行为的CSV文件,对于每一行数据来说,按照逗号进行分割的话,从左到右,每个字段的含义依次表示:用户ID,广告ID,省份,城市,以及时间戳;

在这里插入图片描述

业务实现的需求:

  • 从埋点日志中,统计每小时页面广告的点击量,5秒刷新一次,并按照不同省份进行划分;
  • 对于“刷单”式的频繁点击行为进行过滤,并将该用户加入黑名单;

解决思路分析&

安装 MySQL或File DB安装 编辑反.php文件并将设置修改为所需的设置。 编辑mysql_config.php或filedb_config.php(取决于您希望使用的是什么)。 上传所有.php文件和图像文件(如果使用图形计数器)。 放在所有页面的html中。 访问浏览器中的comp.php文件。注意:如果使用filedb,您的计数器将出现。如果使用MySQL,您的计数器将首先安装,然后您可以刷新页面,您的计数器将显示出来。注2:记得删除安装文件夹。 高级用户安装 编辑计数器和配置文件。 如果使用MySQL,则将dbtables.sql加载到数据库中。 PHP-Nuke w/MySQL 将整个计数器文件夹上传到php-nuke根文件夹(其中安装了php-nuke)。 将/extras/PHP-Nuke/blocks/block-EP-Dev_Counter.php上传到PHP-Nuke的/块/文件夹。 进入PHP-Nuke的管理,单击块,然后添加块“EP-Dev计数器”。 (可选)Edit comp.php注意:您的计数器将首先安装,然后您可以刷新页面,您的计数器就会显示出来。 升级 备份数据库或数据文件! Upgrading from 3.x --> 3.x 编辑反.php文件并将设置修改为所需的设置。 编辑mysql_config.php或filedb_config.php(取决于您希望使用的是什么)。 上传所有.php文件和图像文件(如果使用图形计数器)。 (可选:访问新/stats/页面查看旧的统计数据!) Upgrading from 1.x or 2.x --> 3.x 编辑反.php文件并将设置修改为所需的设置。 编辑mysql_config.php或filedb_config.php(取决于您希望使用的是什么)。 上传所有.php文件和图像文件(如果使用图形计数器)。 访问浏览器中的安装/升级-v3.php,并遵循屏幕上的任何说明。注意:您的旧文件数据库文件/表将升级为新格式,不会丢失任何数据。 特征列表 在线访客/每日访客/访客总数/点击数总数 文件数据库和MySQL数据库都支持。 容易编辑计数器显示文件. 自动数据库裁剪(文件和MySQL) 可配置在线时间 可配置TRIM数据库时间 自动存档选项 点击/访问偏移功能 逗号开/关 图形或文本 可配置数长度 IP忽略 IP阻塞 许多其他特性(我无法再跟上它们了) 故障排除 问题:我的统计页面总是显示我有0名在线访问者。我启用了时间偏移。 解决方案:目前还没有解决这个问题的办法。这是脚本检查服务器时间与数据库中的时间值的结果。如果你想在网上查看你的访问者,只需访问你的实际反.php文件;) 问题:计数器告诉我,我的“绝对路径”设置不正确!? 解决方案:您可以在comp.php中找到绝对路径设置。如果您不知道您的绝对路径,您可以访问Web浏览器中的文件/install/abus.php(包括在此计数器中)。php文件将显示计数器所需的绝对路径。 问题:我的柜台没有出现,而是显示为。 解决方案:确保您的页面是php页面(.php),并且您的服务器上有php。 问题:我不知道如何编辑计数器的布局。 解决方案:编辑-display.html文件。包括以下内容以反映不同的统计数据: 在线访问者-!反-ONPAGE! 今天的访客-!反-今天! 游客总数-!回访! 总命中-!反击! 问题:我不知道MySQL数据库是什么,或者我是否有一个数据库!解决方案:MySQL数据库是存储数据的简单方式和位置。您可以询问您的网站主机是否有(如果有,您的用户名、密码和数据库名称是什么)。如果您没有MySQL数据库,则可以将计数器设置为在comp.php文件中使用文件数据库。 问题:我收到“分析错误:解析错误,意外‘,’.行#”。解决方案:您的HITS_偏移中可能有逗号,请删除它们。 问题:我的柜台没有正确显示访客!它总是保持在1或0。 解决方案:问题的出现与您包含文件的方式有关。这是一个已知的问题,如果您是: (A)通过域链接到脚本 (B)让服务器以其他方式拉出脚本,而不是EP-dev所建议的方式。 修复:只需包含服务器上有绝对路径的浏览器(通常用于CGI脚本)。因此,您的包含看起来类似于:。如果域名是mydomain.com,那么包含的内容可能是这样的:
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小码农叔叔

谢谢鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值