
点击流数据分析项目
文章平均质量分 92
本专栏提供数据处理与分析相关的案例,并尽量提供完整的数据和源代码
IT从业者张某某
致力成为一个做事高效,待人认真,对社会产生价值的人
展开
-
TableAgent数据分析智能体——数据分析师的大模型
TableAgent数据分析智能体的使用与评测。TableAgent也是九章云极的产品,数据分析师可以试一试原创 2023-12-13 12:16:25 · 3384 阅读 · 22 评论 -
游戏增长专题-构建游戏分析技术Game Analytic Pipeline与量江湖分享
游戏分析是可以助力游戏增长的重要因素,同时针对游戏数据的离线和实时数据,想搭建一整套行之有效且具有拓展性的架构还是需要积累沉淀的。专业的事情交给专业的人,专业的人做专业的事情,这也是一种较好的选择,基于Game Analytic Pipline可以快速构建游戏分析技术,基于量江湖的服务可以更好的推广IOS APP。原创 2023-02-23 07:18:52 · 1099 阅读 · 0 评论 -
Day06-数据分析在各行各业的应用与数据思维
本文主要讲述关于数据分析在各个行业的应用,以及运营领域数据分析师的日常工作原创 2023-02-06 07:34:38 · 1105 阅读 · 0 评论 -
Day05-五种常见的数据方法
本文主要介绍常见的数据分析方法,包括公式法,对比法,象限法,二八法,漏斗法等原创 2023-02-05 08:35:30 · 549 阅读 · 0 评论 -
Day04-数据分析模型
本文主要讲解数据分析模型相关,首先包含定性法与定量法,解释数据分析要解决的问题,数据分析师的工作,数据分析流程等内容原创 2023-02-04 17:17:53 · 1042 阅读 · 1 评论 -
Day03-无处不在的数据
数据分析是一个各行+数据分析的行业,本文主要描述了数据分析的场景。原创 2023-02-03 02:00:00 · 455 阅读 · 0 评论 -
Day02-带你走进数据分析的世界
本文是数据分析系列课程,主要讲解了数据分析与我们工作结合的地方,并针对数据分析的结果进行动态展示原创 2023-02-02 07:03:05 · 330 阅读 · 0 评论 -
Day01-数据分析图鉴
本文主要分析数据分析的发展趋势,并介绍数据分析需要的相关技术原创 2023-02-01 07:57:38 · 514 阅读 · 0 评论 -
国内爬虫图鉴
爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,本文是关于国内爬虫的介绍原创 2023-01-31 00:40:20 · 1611 阅读 · 37 评论 -
抖音商品机会潜力分析报告竞赛-3等奖作品分析
抖音商品机会潜力分析报告竞赛3等奖的作品分析,包括对应链接原创 2023-01-18 21:21:34 · 1478 阅读 · 2 评论 -
基于python的turtle实现圣诞树的绘制
文本基于turtle实现可一个圣诞树的绘制,理论上来说,turtle可以绘制任意的画,如果有规律的画更为适合原创 2022-12-28 12:03:34 · 2610 阅读 · 0 评论 -
某高校毕业设计-数据分析课题技术实现篇
某高校毕业设计-数据分析课题技术实现思路包括数据分析目标确定,数据采集处理分析可视化数据挖掘等,原创 2022-12-26 20:08:39 · 1113 阅读 · 1 评论 -
世界杯球队分析
本文主要针对世界杯的相关数据进行分析,提供数据集的下载链接原创 2022-12-02 09:03:25 · 2750 阅读 · 0 评论 -
三峡大学复杂数据预处理day01-day03
三峡大学数据预处理的课程笔记原创 2022-11-26 06:33:06 · 1444 阅读 · 0 评论 -
共享单车数据处理与分析
共享电车的数据分析,包括了pandas,pyecharts等使用原创 2022-11-10 09:43:04 · 7244 阅读 · 60 评论 -
泰迪杯A题通讯产品销售和盈利能力分析一等奖作品
泰迪杯A题通讯产品销售和盈利能力分析一等奖作品原创 2022-11-03 13:52:16 · 5416 阅读 · 11 评论 -
海量数据处理-Python
本文主要海量数据处理-包括分块读取,文件切分,并基于bitmap和布隆过滤器实现海量数据处理原创 2022-01-06 22:26:38 · 2262 阅读 · 2 评论 -
三峡大学-复杂数据预处理实训
三峡大学2022年1月5日-2022年1月14日工程实训内容通知博客。原创 2022-01-04 19:36:21 · 1608 阅读 · 0 评论 -
Python海量数据的生成与处理
本文主要基于python生成5亿条ip数据,并获取其中的出现次数最多的IP地址原创 2021-12-30 17:43:40 · 1972 阅读 · 0 评论 -
9-点击流数据分析项目-前后端展示
本文是点击流数据分析项目的最后一部分,将mysql在的数据进行了前端展示。非常感谢原作者分享的作品。原创 2021-12-29 17:43:31 · 599 阅读 · 0 评论 -
8-点击流数据分析项目-Hive分析
本文完成了点击流分析项目的hive导入,hive分析与hive导出等三个部分。原创 2021-12-29 16:50:00 · 1707 阅读 · 0 评论 -
7-点击流数据分析项目-数据预处理
本文主要实现点击流数据分析项目-数据预处理过程,完成静态页面的过滤,完成pageviews表的梳理,完成访问表visits表的梳理原创 2021-12-29 14:07:30 · 1386 阅读 · 2 评论 -
6-点击流数据分析项目-日志采集到HDFS
本文主要是点击流日志项目的数据采集部分,由于数据采集脚本或配置文件的相似性,本文的内容摘取了网络较为详细的两篇文章,如何融入本项目,读者可以自行借鉴转载 2021-12-29 09:39:12 · 409 阅读 · 0 评论 -
5-网站日志分析案例项目回顾与点击流数据分析项目介绍
本文主要介绍日志数据处理与分析项目的相关背景,包括数据网站日志流量分析与点击流日志分析两种应用场景。原创 2021-12-27 22:38:51 · 1386 阅读 · 0 评论 -
4-网站日志分析案例-日志数据统计分析
本文为网站日志分析案例的第4部分,基于MR清洗后的数据导入HIVE中,然后进行统计分析。原创 2021-12-28 11:55:43 · 1500 阅读 · 0 评论 -
3-网站日志分析案例-MapReduce执行日志清洗
本文网站日志分析案例中的第3部分。本文主要实现日志的清洗,将54w条日志数据进行清洗,清洗后得到17w条数据。原创 2021-12-28 10:43:05 · 1200 阅读 · 0 评论 -
2-网站日志分析案例-日志采集:Flume-Kafka-Flume-HDFS
本文主要实现了基于flume+kafka+flume的完整日志采集过程,并针对一些必备的安装过程和使用命令进行简单介绍。原创 2022-01-02 23:32:36 · 3094 阅读 · 0 评论 -
2-网站日志分析案例-基于Flume采集WEB日志-windows版本
本文主要基于Flume实现了日志的采集,本文案例不复杂,但由于基于windows实现的案例不多,笔者尽量把自己遇到的问题描述在博客中,包括编码问题和配置的注意事项,减少大家的试错成本。原创 2021-12-21 14:02:16 · 1734 阅读 · 0 评论 -
1-网站日志分析案例-日志数据处理介绍
本文是网站日志分析案例的第1部分,主要用于数据集介绍,日志分析的常用指标介绍,并针对案例的实现流程进行描述。转载 2021-12-28 07:31:19 · 1391 阅读 · 0 评论 -
基于Python实现WEB日志生成
本文主要介绍常见的web服务器与web日志的格式,并基于python实现了随机日志生成。在实现过程中,主要解决了userAgent的随机生成,本地时间的动态生成。原创 2021-12-21 11:31:31 · 1666 阅读 · 0 评论