大数据
文章平均质量分 54
主要介绍大数据相关知识与技术
疯狂的布布
知道越多不知道越多
展开
-
Nginx基础教程
什么是Nginx?Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务。Nginx是由伊戈尔·赛索耶夫为俄罗斯访问量第二的Rambler.ru站点开发的,第一个公开版本0.1.0发布于2004年10月4日。2011年6月1日,nginx 1.0.4发布。其特点是占有内存少,并发能力强,事实上nginx的并发能力在同类型的网页服务器中表现较好,中国大陆使用nginx网站用户有:百度、京东、新浪、网易、腾讯、淘宝等。在全球活跃的网站原创 2022-01-03 10:58:03 · 1482 阅读 · 3 评论 -
MapReduce在yarn中的执行过程
在MapReduce工作原理简介中我简单的了解了MapReduce的工作原理,在这篇文章中,我们将要了解MapReduce的执行过程。我们知道从Hadoop2.X,采用的是yarn作为资源管理系统,我们将要了解MapReduce在yarn中的执行过程。同样,对于yarn,网上有很多大神的写的博客,这里我主要是结合自己的理解,对知识进行积累。1.概念名词简介 yarn是资源管理系统,采用的是Master/slave结构,不仅可以运行MapReduce应用,还可以运行Spark,Storm等应用,..转载 2021-12-12 19:38:49 · 1230 阅读 · 0 评论 -
influxdb产生实时数据
开发工具:idea 简历maven工程<dependency> <groupId>org.influxdb</groupId> <artifactId>influxdb-java</artifactId> <version>2.17</version></dependency><dependency> <groupId>com.github原创 2021-09-27 19:21:17 · 5596 阅读 · 0 评论 -
influxdb基础入门
1.下载wget https://dl.influxdata.com/influxdb/releases/influxdb-1.7.8_linux_amd64.tar.gz2.解压tar zxvf influxdb-1.7.8_linux_amd64.tar.gz3.创建目录mkdir -p/home/fengjun/influxdb/datamkdir -p/home/fengjun/influxdb/logmkdir -p/home/fengjun/influxdb/m...原创 2021-09-26 14:58:25 · 742 阅读 · 0 评论 -
数据分析流程
明确问题:明确问题是数据分析钟的第一步,必须明确数据分析的真实需求理解数据:数据获取和数据探索数据清洗: 一个数据分析项目大部分时间花在数据清洗上数据分析和可视化: 对清洗后的数据进行分析,并且通过可视化展示出结果结果和建议: 对结果进行解读,得出有价值的结论并且提出相关建议...原创 2021-09-19 14:08:44 · 76 阅读 · 0 评论 -
Hive 和数据库比较
由于 Hive 采用了类似 SQL 的查询语言 HQL(Hive Query Language),因此很容易 将 Hive 理解为数据库。其实从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无 类似之处。本文将从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用 中,但是 Hive 是为数据仓库而设计的,清楚这一点,有助于从应用角度理解 Hive 的特性。1.4.1 查询语言 由于 SQL 被广泛的应用在数据仓库中,因此,专门针对 Hive 的特性设计了类 SQL原创 2021-08-17 10:32:05 · 162 阅读 · 0 评论 -
Hive和HBase的区别与联系
HBASE想了解更多大数据相关知识可以加V免费领取资料哦:mipi946Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。单个的从字面意思上或许很难看出二者的区别,别急,下面我们就对二者做个详细的介绍。两者的特点Hive帮助熟悉SQL的人运行MapReduce任务。因为它是JDBC兼容的,同时,它也能够和现原创 2021-08-17 10:28:39 · 457 阅读 · 0 评论