自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Alice菌的博客

大数据 | 程序人生 | 公众号【猿人菌】| 个人网站 : http://alices.ibilibili.xyz/ | 乾坤未定,你我皆是黑马!

  • 博客(66)
  • 资源 (7)

原创 全网最全Python学习路线图+14张思维导图,让python初学者不走弯路!

        最近忙着做大数据的项目,故有一段时间没更新Python专栏的内容了。        突发奇想,想把当初自学python时收藏的关于python的14张思维导图和学习路线拿出来分享给许多同样处于"初级"阶段的各位攻城狮们。...

2019-12-28 00:51:03 23266 118

原创 大数据技术原理与应用之【流计算】习题

1.试述流数据的概念流数据,即数据以大量、快速、时变的流形式持续到达。2.试述流数据的特点流数据具有如下特征:数据快速持续到达,潜在大小也许是无穷无尽的数据来源众多,格式复杂数据量大,但是不十分关注存储,一旦经过处理,要么被丢弃,要么被归档存储注重数据的整体价值,不过分关注个别数据数据顺序颠倒,或者不完整,系统无法控制将要处理的新到达的数据元素的顺序4.试述流计算的需求对于...

2019-12-29 22:56:44 2323

原创 大数据技术原理与应用之【大数据处理架构Hadoop】习题

1.试述hadoop和谷歌的mapreduce、gfs等技术之间的关系答:Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。2.试述Hadoop具有哪些特性。答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在Linux平台,支持多种编程语言3.试述Hadoop在各个...

2019-12-29 21:24:19 2447

原创 大数据技术原理与应用之【HDFS】习题

1.试述分布式文件系统设计的需求。设计需求含义HDFS的实现情况透明性具备访问透明性、位置透明性、性能、和伸缩透明性只能提供一定程度的访问透明性,完全支持位置透明性、性能和伸缩透明性并发控制客户端对于文件的读写不应该影响其他客户端对同一个文件的读写机制非常简单,任何时候都只允许有一个程序写入某个文件文件复制一个文件可以拥有不同位置的多个副本HDFS采...

2019-12-29 18:56:15 2563

原创 Unable to read additional data from server sessionid 0x0解决

        今天在一个节点上进入到zookeeper命令行时,报了下面这个异常!后来经过查找了资料才明白,我集群上安装了3台zookeeper。zookeeper有个选举算法,当整个集群超过半数机器宕机,zookeeper会认为集群处于不可用状态。所有,3台机器只启动一台无法连接,如果启动2台及以上就可以连...

2019-12-29 11:41:32 3588

原创 大数据技术原理与应用之【云数据库】习题

1.试述云数据库的概念。答:云数据库是部署和虚拟化在云计算环境中的数据库。云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法,它极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易,同时,也虚拟化了许多后端功能。云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点。2.与传统的软件使用方式相比,云计算这种模式具有哪些明显的...

2019-12-29 00:48:55 2644

原创 Phoenix的索引介绍与创建

        在海量数据背景下,查询数据快速返回是典型的应用场景。在phoenix数据表基础之上创建索引,能够大幅提高数据的查询效率。Phoenix支持的索引有三个类型,分别是覆盖索引、全局索引、本地索引。        A: 覆盖索...

2019-12-29 00:20:40 2057 20

原创 用ImageGrab.grabclipboard()获取的图片时出现错误AttributeError: 'NoneType' object has no attribute 'save'解决方案

        今天使用Python图像处理库ImageGrab,在调用==grabclipboard()==方法获取到剪切板上图片的时候报了这个让我懵圈了的异常~~后来查了官方文档才知道,grabclipboard函数有一个缓存的问题,操作太快,有时候它就会读取上一次的内容,因为第一个没有读取到图像,所以报错了。...

2019-12-28 17:47:11 3042 1

原创 Phoenix的使用方式详解

        本篇博客小菌为大家分享的是关于Phoenix的使用方式与常用shell。        前文传送门:《Phoenix(凤凰)的安装介绍》Phoenix使用     &n...

2019-12-28 10:53:13 2099 20

原创 Phoenix(凤凰)的安装介绍

        本篇博客,小菌为大家带来的是关于Phoenix的入门介绍及安装说明。        Phoenix 介绍        phoenix,中...

2019-12-28 00:17:38 2066 16

原创 把本地的文件数据导入到Hive分区表--系列①Java代码

        本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本篇将介绍第一种—Java代码。             &nb...

2019-12-25 23:31:02 2877 2

转载 大数据学习体系说明

大数据需要学习什么?很多人问过我这个问题。总是没有一个合适的契机去好好总结这些内容,大数据是近五年兴起的行业,发展迅速,很多技术经过这些年的迭代也变得比较成熟了,同时新的东西也不断涌现,想要保持自己竞争力的唯一办法就是不断学习。干货走起,闲话不多说,以下就是小编整理的大数据学习思路附上学习路线图第一阶段:linux系统本阶段为大数据学习入门基础课程,帮大家进入大数据领取打好Linux基础,...

2019-12-22 22:07:43 2603

原创 HBase:Region管理与Master工作机制

        本篇博客小菌为大家带来的是HBase的Region管理与Master工作机制。region 的管理        首先让我们来看下region的管理,当然这存在一个前提: 任何时刻,一个region只能分配给一个regi...

2019-12-22 21:22:56 2693 8

原创 HBase的读写流程

        本篇博客小菌为大家带来的是关于HBase的读写路程的介绍。        读请求流程在介绍之前先为大家科普几个前提!什么是meta表?meta 表时hbase系统自带的一个表。里面存储了hbase用户表的原信息。...

2019-12-22 20:39:32 2599 9

原创 io.UnsupportedOperation: not writable异常解决

        今天在做python语感练习的时候,报了如下异常:就是这个红彤彤的异常io.UnsupportedOperation: not writable翻译一下,意思是不支持写入的权限。仔细检查了一下,才发现在第一次打开文件的时候忘了设置权限了,于是添加上了之后,程序就成功运行了!!!...

2019-12-22 11:33:18 16381 20

原创 大数据技术原理与应用之【NoSQL数据库】习题

1.如何准确理解NoSQL的含义?        NoSQL是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的一类统称,它采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型。2.试述关系数据库在哪些方面无法满族Web2.0应用的需求。关系数据库已经无法满足Web2...

2019-12-21 11:26:02 3694

原创 HBase的rowKey设计技巧

        本篇博客小菌为大家带来的是HBase的rowKey设计技巧!        HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(...

2019-12-20 23:31:16 2593 8

原创 HBase的预分区介绍及设置

        本篇博客小菌为大家带来关于HBase的预分区的内容分享!        在正式开始介绍之前,我们先联系一下之前所学的内容 , 想想原本数据分区(分region)的过程是怎样的?   &nb...

2019-12-20 23:05:12 2736 8

原创 HBase的3个重要机制

        本篇博客,小菌为大家带来的是关于HBase的3个重要机制。        1.flush 机制1.(hbase.regionserver.global.memstore.size) 默认;堆大小的40%regionServer的全局memstore的大小,超过该大小会触发flush到磁盘的操作,默认是堆大小的40%,而且reg

2019-12-18 16:28:00 2867 8

原创 HBase的JavaAPI使用--进阶篇--过滤器的使用

        本篇博客,小菌为大家带来HBase的进阶使用,关于基础入门操作大家可以去阅览小菌之前的博客《HBase的JavaAPI使用–基础篇》。        在展示代码之前先为大家介绍一下过滤器,同时它也是我们这篇博客介绍的主角。...

2019-12-18 13:43:40 3092 8

原创 org.apache.hadoop.hbase.TableNotDisabledException异常解决

        今天在使用JavaAPI操作HBase,当删除数据表时,程序运行报了这个异常。        org.apache.hadoop.hbase.TableNotDisabledException解决方案也很简单根据报错...

2019-12-18 11:23:20 3245

原创 HBase的JavaAPI使用--基础篇

        本篇博客小菌为大家带来的是关于HBase的JavaAPI使用。创建项目,导入pom <repositories> <repository> <id>cloudera</id> <ur...

2019-12-17 17:45:04 3145

原创 HBase使用JavaAPI连接出现java.io.IOException: java.lang.reflect.InvocationTargetException异常解决

        今天在使用JavaAPI连接HBase,运行时出现了这个异常。                zjava.io.IOException: j...

2019-12-17 16:35:01 3692 1

原创 HBase简答题(持续更新)

1.HBase的基本介绍a.Hbase是建立在hdfs之上的一个数据库,b.不支持join等SQL复杂操作c.支持的数据类型:byte[],d.依靠横向扩展,一个表可以有上十亿行,上百万列。e.面向列(族)的存储和权限控制f.对于为空(null)的列,并不占用存储空间,是一个稀疏表。2.HBASE的适用场景海量数据、精确查询、快速返回海量数据:指的是数据量的背景精确查询:业务场...

2019-12-16 18:15:51 3320

原创 读书笔记摘抄(5)

        没有人活在保鲜膜中        没有人能永葆青春        单做一个心思细腻、热爱生活的人   &nb...

2019-12-15 23:34:22 3045

转载 Apache Kylin(麒麟)入门介绍

为什么需要Kylin?     &n...

2019-12-15 22:31:15 3093

转载 一文读懂Apache Kylin(麒麟)

“麒麟出没,必有祥瑞。”                              —— 中国古谚语Kylin思维导图前言随着移动互联网、物联网等技术的发展,近些年人类所积累的数据正在呈爆炸式的增长,大数据时代已经来临。但是海量数据的收集只是大数据技术的第一步,如何让数据产生价值才是大数据领域的终极目标。Hadoop的出现解决了数据存储问题,但如何对海量数据进行OLAP查询,却...

2019-12-15 22:26:33 3149

原创 Sqoop入门介绍及安装

介绍        Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。        Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译...

2019-12-15 19:58:57 3097

原创 大数据技术原理与应用之【Spark】习题

1.Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。答:Spark具有如下4个主要特点:①运行速度快;②容易使用;③通用性;④运行模式多样。        2.Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark...

2019-12-15 19:15:06 4525 2

原创 11个“高能”网站,学编程和赚钱两不误!

0.GitHub —开发者最最最重要的网站:https://github.com这个不用多说了吧,代码托管网站,上面有很多资源,想要什么轮子,上去搜就好了。并且呢,上面有很多优秀的程序员,你可以在这里交到很多好朋友喔。1.掘金帮助开发者成长的技术社区:https://juejin.im现在国内优质的开发者交流学习社区,可以去看大佬们写的文章,也可以自己分享学习心的,与更多开发者交流。...

2019-12-15 14:22:35 3085 18

原创 大数据技术原理与应用之【HBase】习题

1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系答: HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase的底层数据导入功能,Pig和Hive为HBase提供了高层语言支持,HBase是B...

2019-12-14 22:35:39 4582

原创 HBase底层原理(多维度分析)

        本篇博客,小菌为大家带来的是关于HBase底层原理的讲解!        先上HBase的系统架构图        系统架构是不是看的...

2019-12-13 20:56:34 4341

原创 HBase的高级shell管理命令

        继上一篇《HBase常用的shell操作》博客之后,本篇小菌将为大家带来的是关于HBase的高级shell管理命令。        status例如: 显示服务器状态hbase(main):058:0> st...

2019-12-12 19:55:52 3747 13

原创 HBase常用的shell操作(清楚详细,小白福利!)

        本篇博客,小菌为大家带来的是HBase常用的shell操作。关于HBase的入门介绍《HBase入门介绍(从基础到架构)》与集群环境搭建《HBase的集群环境搭建》,需要的小伙伴们可自行食用!1.进入HBase客户端命令操作界面因为我们在之前已经配置好了环境变量,所以只需要在hbase shell...

2019-12-12 11:21:51 3862 5

转载 Python新手到熟练的百天之路

给大家推荐一个Python资源。有位名叫骆昊 (jackfrued) 的资深程序员,为...

2019-12-12 10:15:10 4161 20

原创 HBase入门介绍(从基础到架构)

        本篇博客,小菌为大家带来的是关于HBase的入门介绍!                文章目录1.HBase 基本介绍简介HBase的发展...

2019-12-12 08:41:53 3789

转载 想要学好大数据需掌握这十二大技术!

        大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。   &nb...

2019-12-11 23:02:55 3449

原创 如何提高CSDN博客的访问量

        开设CSDN博客也有几天时间了,博客的访问量已逐步逼近7000。虽然不是很多,但小菌已经非常满足了,毕竟在CSDN上开源分享,总结经验才是最重要的,访问量,点赞数,评论数等附加数据则是用来评判博客内容质量好坏以及其本身受欢迎程度。最近小菌去浏览了一下博客周排行榜以及总排行榜的那些博客专家,IT大佬们的博...

2019-12-11 23:02:06 6096 3

原创 Hue集成Hbase

        本篇博客,小菌为大家带来的是Hue集成Hbase的分享。        1.修改hbase配置在hbase-site.xml配置文件中的添加如下内容,开启hbase thrift服务。修改完成之后scp给其他机器上h...

2019-12-11 21:20:53 3942

原创 HBase的集群环境搭建

        本篇博客,小菌为大家带来的是关于HBase的集群环境搭建。        在开始之前,有一个注意事项:HBase强依赖zookeeper和hadoop,安装HBase之前一定要保证zookeeper和hadoop启动成功,...

2019-12-11 17:29:35 3766

互联网常见人事面试题.doc

如今现在的“人事”一词常指人力资源管理术语,包含两层意思,一是指人事工作,二是指人事工作人员,现流程称作HR。 人事工作也是指人力资源管理工作,包含:人力资源规划、招聘、培训、绩效、薪酬和员工关系六大模块的一种管理工作。人事工作人员则是指从事人事工作的人,是公司的一个重要职位。负责公司人事工作的部门则称为人事部或人力资源部。

2020-06-07

SpringBoot+SpringCloud面试题.doc

Spring boot 是 Spring 的一套快速配置脚手架,可以基于spring boot 快速开发单个微服务,Spring Cloud是一个基于Spring Boot实现的云应用开发工具;Spring boot专注于快速、方便集成的单个个体,Spring Cloud是关注全局的服务治理框架;spring boot使用了默认大于配置的理念,很多集成方案已经帮你选择好了,能不配置就不配置,Spring Cloud很大的一部分是基于Spring boot来实现。Spring boot可以离开Spring Cloud独立使用开发项目,但是Spring Cloud离不开Spring boot,属于依赖的关系。

2020-06-07

MQ-A级面试题.pdf

消息队列(MQ),是一种应bai用程序du对应用程序的通信方法。zhi应用程序通过写和检索dao出入列队的针对应用程序的数据(消息)来通信,而无需专用连接来链接它们。

2020-06-07

Java面试 58题.docx

Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。

2020-06-07

数据可视化驾驶舱.rar

关于大数据可视化实时大屏展示的20套的html源代码,包含智慧物流,大数据分析系统,人口分析系统,可视化监控管理....等等,值的大数据爱好者下载后好好研究!

2020-04-29

大数据面试宝典-精简版.pdf

从Java基础,JVM,数据库,hadoop,hive,hbase,flume,zookeeper,kafka,scala,redis,机器学习,业务相关多个角度分析了大数据面试可能遇到的问题,非常详细,建议大数据专业的学者都应该阅读一下。

2020-04-06

HBuilder的安装

HBuilder是DCloud(数字天堂)推出的一款支持HTML5的Web开发IDE。 HBuilder的编写用到了Java、C、Web和Ruby。HBuilder本身主体是由Java编写。 它基于Eclipse,所以顺其自然地兼容了Eclipse的插件,喜欢的朋友可以按照里面的教程来使用!

2019-02-02

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除