大数据BigData
文章平均质量分 80
Big Data 相关
数字游牧人0v0
当你的才华还撑不起你的野心的时候,你就应该静下心来学习;
当你的能力还驾驭不了你的目标时,就应该沉下心来,历练;
梦想,不是浮躁,而是沉淀和积累,只有拼出来的美丽,没有等出来的辉煌,
机会永远是留给最渴望的那个人,学会与内心深处的你对话,问问自己,想要怎样的人生,
静心学习,耐心沉淀,送给自己,共勉。
展开
-
[超硬核]一文带你入门用户画像
用户画像用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌,如图1-1所示。用户画像可看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。由此看来,如何从海量数据中挖掘出有价值的信息越发重要。大数据已经兴起多年,其对于互联网公司的应用来说已经如水、电、空气对于人们的生活一样,成为不可或缺的重要组成部分。从基础设施建设到应用层面,主要有。原创 2023-10-19 18:26:05 · 218 阅读 · 0 评论 -
Linux基础和命令
12.输入输出重定向及管道。原创 2023-10-19 18:11:32 · 104 阅读 · 0 评论 -
Spark集群环境搭建
Spark原创 2023-07-23 17:17:08 · 234 阅读 · 0 评论 -
Flink窗口【我们不一样】
在大多数场景下,我们需要统计的数据流都是无界的,因此我们无法等待整个数据流终止后才进行统计。通常情况下,我们只需要对某个时间范围或者数量范围内的数据进行统计分析:如每隔五分钟统计一次过去一小时内所有商品的点击量;或者每发生1000次点击后,都去统计一下每个商品点击率的占比。在 Flink 中,我们使用窗口 (Window) 来实现这类功能。按照统计维度的不同,Flink 中的窗口可以分为 时间窗口 (Time Windows) 和 计数窗口 (Count Windows)。原创 2023-07-23 16:59:02 · 57 阅读 · 0 评论 -
Flink核心概念【我们不一样】
Apache Flink 诞生于柏林工业大学的一个研究性项目,原名 StratoSphere。2014 年,由 StratoSphere 项目孵化出 Flink,并于同年捐赠 Apache,之后成为 Apache 的顶级项目。2019 年 1 年,阿里巴巴收购了 Flink 的母公司 Data Artisans,并宣布开源内部的 Blink,Blink 是阿里巴巴基于 Flink 优化后的版本,增加了大量的新功能,并在性能和稳定性上进行了各种优化,经历过阿里内部多种复杂业务的挑战和检验。原创 2023-07-23 16:44:00 · 154 阅读 · 0 评论 -
【玩转Docker】
docker原创 2022-09-08 14:03:51 · 403 阅读 · 0 评论 -
Apache Sqoop详细教程
Apache Sqoop1. sqoop 介绍Apache Sqoop 是在Hadoop 生态体系和RDBMS 体系之间传送数据的一种工具。来自于Apache软件基金会提供。Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。Hadoop生态系统包括:HDFS、Hive、Hbase等RDBMS体系包括:Mysql、Oracle、DB2等Sqoop可以理解为:“SQL 到 Had.原创 2022-05-09 14:18:19 · 686 阅读 · 0 评论 -
【常见的大数据存储工具】
常见的大数据存储工具原创 2022-09-06 15:49:41 · 2081 阅读 · 0 评论 -
基于Zookeeper搭建Kafka高可用集群
基于Zookeeper搭建Kafka高可用集群原创 2022-11-15 16:06:09 · 212 阅读 · 0 评论 -
Zookeeper单机环境和集群环境搭建
Zookeeper单机环境和集群环境搭建原创 2022-11-15 16:03:05 · 279 阅读 · 0 评论 -
Spark集群环境搭建
spark集群搭建原创 2022-11-15 15:57:26 · 171 阅读 · 0 评论 -
Linux环境下Hive的安装部署
Hive原创 2022-11-09 21:30:00 · 415 阅读 · 0 评论 -
HBase集群环境搭建
集群安装Hbase原创 2022-11-09 17:01:07 · 198 阅读 · 0 评论 -
HBase单机环境搭建
Hbase单机安装原创 2022-11-09 16:58:44 · 587 阅读 · 0 评论 -
Hadoop集群环境搭建
大数据组件安装原创 2022-11-09 16:55:05 · 109 阅读 · 0 评论 -
Hadoop单机环境搭建
大数据组件安装原创 2022-11-09 16:52:26 · 474 阅读 · 0 评论 -
Flink单机模式,集群模式安装
大数据组件部署原创 2022-11-09 16:48:47 · 1871 阅读 · 0 评论 -
Azkaban_3.x_编译及部署
大数据组件原创 2022-11-09 16:42:37 · 103 阅读 · 0 评论 -
Linux下Flume的安装
大数据组件安装原创 2022-11-09 16:32:56 · 206 阅读 · 0 评论 -
Linux下Python安装
大数据组件以及环境安装原创 2022-11-09 20:45:00 · 197 阅读 · 0 评论 -
Linux下JDK安装
大数据组件安装原创 2022-11-09 16:25:10 · 208 阅读 · 0 评论