自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据Spark教程

大数据Spark教程

  • 博客(6)
  • 收藏
  • 关注

原创 新手大数据必问十个问题

无论在学习群、星球还是私底下,总有很多想学大数据的同学会问这几个问题。今天列举了这十个高频问题,虽然基础,但是经典。1. 电脑需要什么配置?学大数据的电脑配置主要在内存方面,至少8G,上不封顶,一般16G够用。当然这只是学习层面,自己搭虚拟机玩玩。工作中,公司自然会给你分配服务器让你工作。2. 有哪些方向?数据开发、数据分析、数据挖掘。其中...

2019-11-20 17:59:37 146

原创 大数据学习与分享

今天这篇文章不讲具体的技术,主要解答一下如下几个问题,通过这几个问题的解答,希望小伙伴们能够对【大数据学习与分享】有一个深度的了解。1.【大数据学习与分享】主要是做什么的?通过公众号的简介,相信小伙伴们已经对本公众号主要做什么有所了解,但是在这里,还是很有必要提一下。本公众号主要专注于大数据领域常用的技术,如Spark、Hadoop、Hive、HBase、Kafka、Zookeeper等技...

2019-11-19 17:26:02 186

原创 高性能计算、大数据与机器学习的融合

2019年9月,美国国家科学技术理事会(NSTC)发布《高性能计算、大数据与机器学习的融合》报告,对美国网络与信息技术研发计划(NITRD)大数据与高端计算研发机构间工作组于去年10月举行的同名会议进行了总结。关键结论(1)随着数据量的急速增加,在科学需求的推动下,高性能计算(HPC)、大数据(BD)和机器学习(ML)不断融合。数据的产生不再是瓶颈,取而代之的是数据的管理、分析和推理。...

2019-11-18 18:34:45 1050

转载 大数据学习:比较容易理解的Hbase架构全解

依然是Hadoop组件的讲解,今天说到HBase 架构,都是一字一句打出来的,希望各位转发加关注,会一直给大家写优质的内容。物理上,Hbase 是由三种类型的 server 组成的的主从式(master-slave)架构:Region Server,负责处理数据的读写请求,客户端请求数据时直接和 Region Server 交互。HBase Master,负责 Region 的分配...

2019-11-12 16:27:10 167

原创 大数据学习,Hive实践分享之存储和压缩的坑

很多学习大数据的小伙伴都知道,HIVE是非常重要绕不过去的技术,那今天我就将我在大数据公司的一个项目上遇到的HIVE的坑和大家分享下大家都知道,由于集群资源有限,我们一般都会针对数据文件的「存储结构」和「压缩形式」进行配置优化。在我实际查看以后,发现集群的文件存储格式为Parquet,一种列式存储引擎,类似的还有ORC。而文件的压缩形式为Snappy。具体的操作形式如下:①...

2019-11-09 17:24:57 143

原创 大数据是什么?初学者怎样理解大数据技术

大数据是什么?相信这是很多初学者的疑问,大数据技术是一系列围绕数据价值化的技术总称,包括数据采集技术、数据存储技术、数据分析技术、数据呈现技术以及数据应用技术等,其中大数据技术与物联网技术、云计算技术、边缘计算技术和人工智能技术有紧密的联系。按照目前大数据产业链的分布来说,大数据技术是从数据采集技术开始的,目前主要的数据采集渠道包括物联网系统(占比百分之90以上)、Web系统(含App)...

2019-11-06 18:39:06 3231

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除