- 博客(5)
- 收藏
- 关注
原创 Hdoop 知识初步探索 大数据-云计算-物联网的世界
Hadoop—大数据分析 基础教程我们学习一个新内容时,都需要了解他的内部原理和应用,比如大数据这个火爆的词语,几乎现在每个公司人人都在用,那么用的好与坏也模棱两可,那么真正意义上的大数据是什么呢?其实大数据就是收集各种数据,经过分析后用来做有意义的事情,其中包括对数据进行采集,管理,存储,搜索,共享,分析和可视化比如说我们社交网路每天的超大数据记录,这个时候单台机器的存储量和其效...
2019-10-24 10:49:18 260
原创 Hive 超详细基础知识指南,手把手带你进入Hive殿堂
Hive学习指南你好,这是一个初学者对于Hive学习的一个知识体系框架,写这篇博客的目的是想对自己的一个知识体系进行一个全方位的概括,同时也希望自己的心得体会能够帮助到大家。前言我是在大三下暑假实习的时候接触HIVE数据库的,因为学校没有学过,所以在公司自学时就不像在学校有同学和老师的那种学习环境,所有东西都要自己去了解自己去体会,而且Hive并没有好的文档,所以本篇博客的目的是帮助引导那...
2019-10-21 15:39:12 1038 4
转载 AWS的介绍和使用
1. 什么是AWS自 2006 年初起,亚马逊开始在云中为各种规模的公司提供技术服务平台。利用 AWS 服务,软件开发人员可以轻松购买计算、存储、数据库和其他基于 Internet 的服务来支持其应用程序。开发人员能够灵活选择任何开发平台或编程环境,以便于其尝试解决问题。由于开发人员只需按使用量付费,无需前期资本支出,AWS 服务是向最终用户交付计算资源、保存的数据和其他应用程序的一种最经济划算...
2019-11-04 17:18:48 2008
原创 Hbase 理论知识讲解和常用语句
HBase理论知识详解1.历史HBase是属于非关系型数据库(NoSQL),他最早起源于Google发布的Bigtable,经过发展,他已经成为一种广泛应用于各种行业生产的成熟技术,它的用户包括Adobe,Twitter和雅虎等公司。2.关于NoSQL在我们了解HBase的时候我们要先去了解非关系型数据库,按常理说,关系型数据库能解决很多问题,但是随着社会的发展,数据量的增大和对性能的要求...
2019-11-01 16:18:26 192
原创 Spark--理论知识详解 (外加PySpark的应用)
1.初识Spark1.1 Spark(基础原理知识)Spark是一个开源的,强大的分布式查询和处理引擎,他提供MapReduce的灵活性和扩展性(不以Mapreduce的数据处理框架),当数据存储在内存中时,他比Apache Hadoop快100倍,访问磁盘时高达10倍他支持高级API有:1.Scala2.Java3.Ptyhon4.R而今天我们就要了解Pyspark的运用...
2019-11-01 14:40:26 222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人