自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SunnyRivers

别以为自己到了极限,那可能只是别人的起点!

  • 博客(15)
  • 资源 (9)
  • 收藏
  • 关注

原创 HBase完全分布式搭建

节点分布情况  (这里把HMaster和NameNode搭建在一个节点,但是实际开发中,别这样做)前提条件(每个节点)(1)Java环境变量(2)时间同步(3)主从免秘钥(4)启动hadoop 1. 配置hbase-site.xml<configuration>        <property>               ...

2018-04-30 17:10:09 3271

原创 HBase伪分布式搭建

伪分布式一般都是用在测试环境中使用前提:Java环境配置HBase伪分布式搭建步骤:1. 上传并解压HBase的jar包,并把解压后的文件移动到/opt/software目录 2. 配置环境变量 配置完记得刷新 . /etc/profile3. 二次JAVA_HOME配置  4. 配置hbase-site.xml<property><name>hbase.rootdir&l...

2018-04-30 14:12:59 347

原创 Hadoop架构中各个集群在开发中的作用

学习大数据,如果只是零零散散地学习各个模块,就会深陷其中,很难深入了解hadoop架构中各个集群的作用。那么在实际开发中,究竟是怎样的一个流程呢?先看下面一张流程图:接下来就用一些大白话,来讲解每个模块的实际应用。大数据工程师应该从哪里收集用户的访问数据呢?一般可以从两个地方可以取,一个是客户端,一个是服务端。如果从服务器取数据,比如服务器每天在晚上8点到9点之间用户访问量非常多,而如果我们也从服...

2018-04-30 09:28:42 2699

原创 Hive多用户模式搭建

多用户模式也称远程服务模式,用户非java客户端访问元数据库,在服务端启动MetaStoreServer,客户端利用Thrift协议通过MetaStoreServer访问元数据库。使用hive多用户模式前提:(1)启动hadoop集群(2)启动mysql服务节点规划:hadoop01作为mysql服务,用来存放元数据信息hadoop03作为hive服务端hadoop04作为hive客户端搭建步骤:...

2018-04-29 16:42:00 1580

原创 Hive单用户模式搭建

单用户模式是通过网络连接到一个数据库中,是最经常使用到的模式。使用hive的前提:(1)启动hadoop集群(2)启动mysql服务节点规划:hadoop01为mysql存放元数据hadoop02搭建hive单用户模式搭建步骤:1.上传好tar包,后解压:tar -zxvf apache-hive-1.2.1-bin.tar.gz...

2018-04-29 16:33:44 856

原创 Linux系统下安装Mysql数据库

大概就下面几个步骤:1.挂载磁盘mount /dev/cdrom /mnt说明已经挂载了2.安装mysqlyum install mysql-server -y3.启动mysql服务service mysqld start4.验证是否安装成功[root@node01 ~]# mysqlWelcome to the MySQL monito...

2018-04-29 16:23:16 289

原创 大数据面试都问些什么?

其实不管是哪家公司面试,都是根据你的简历来对你进行提问,所以自己简历上面写的知识点都要全部对答如流。还有慎用精通这样的字眼,工作五年以上的人,也不敢说自己对哪一方面能够达到精通的地步。下面是网上找的一些面试经历,可以看得出来问的都是大数据的基本知识点(可查阅这个大纲),而且现在大数据的面试官也不见得都是大牛,保持好心态,把自己真正懂的知识很流畅的表达出来即可。公司A:1.讲讲你做的过的项目。 项目...

2018-04-22 19:48:40 6217

原创 eclipse如何开发python

有一些eclipse的忠实粉丝,怎么都不情愿使用pycharm......那就继续使用eclipse吧(无语...)操作步骤:1.下载python需要的插件点击下载2.解压完后生成这样两个文件夹3.分别把两个文件夹里的文件拷贝到eclipse对应的目录中4.重启eclipse后,就可以开心的new project了可是....工程名都没办法输入5.这是因...

2018-04-16 21:25:22 898

原创 Windows系统中搭建Python编译环境

Windows系统并非都默认安装了Python,因此你可能需要下载并安装它,再下载并安装一个文本编辑器(用之前的PyCham:点击打开链接)。1. 安装Python首先,检查你的系统是否安装了Python。为此,在“开始”菜单中输入 command 并按回车以打开一个命令窗口;你也可按住Shift键并右击桌面,再选择“在此处打开命令窗口”。在终端窗口中输入python并按回车;如果出现了Pytho...

2018-04-16 10:32:24 1021

原创 怎么学习新技术

最新有些偷懒行为,导致很长一段时间,技术没有任何长进,心里慌乱无比,准备看一些新技术,但是又不知道怎么去学习,硬着头皮去看,发现不但效率低下,而且容易打击自信心。于是静下心来总结了一下,究竟该怎么学习新技术,才能更加有效率。在企业管理中经常会使用5W+1H的原则,我感觉在IT行业同样适用。What:这个技术究竟是什么Why:为什么会产生这个技术Who:这个技术有哪些程序员使用W...

2018-04-15 20:46:41 306

原创 安装MySql报错(This application requires .NET Framework x.x.x)

这个主要原因是下载了最新版本的MySql,而系统中没有对应的.NET Framework造成的,所以会报如下错误:解决方法:在下面网站下载对应的.NET Framework:https://www.microsoft.com/en-us/download(刚开始运行有点慢,不要着急)执行完毕后,在安装MySQL就不会报错了。...

2018-04-14 12:37:47 2438 2

原创 卸载MySql详细步骤

这里以Windows 7 为例,其他系统都差不多。1.在Windows服务中停止MySQL的服务。2.打开“控制面板”,单击“程序和功能”,找到“MySQL”,右键单击从下拉菜单中选择卸载(或者使用其他软件如360来卸载)。3.卸载完成后,删除安装目录下的MySQL文件夹及程序数据文件夹,如C:\Program Files(x86)\MySQL和C:\Program Data\MySQL。(上面的...

2018-04-14 11:35:03 636

原创 冒泡排序详细分析

 它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越大的元素会经由交换慢慢“浮”到数列的顶端,故名“冒泡排序”。(上面是百度出来的,我自己做一个简单的解释:相邻元素两两比较,大的往后放,第一次完毕,最大值出现在了最大索引处) 算法原理冒泡排序算法的...

2018-04-04 17:08:23 581

原创 Spark共享变量(广播变量、累加器)

Spark两种共享变量:广播变量(broadcast variable)与累加器(accumulator)累加器用来对信息进行聚合,而广播变量用来高效分发较大的对象。共享变量出现的原因:通常在向 Spark 传递函数时,比如使用 map() 函数或者用 filter() 传条件时,可以使用驱动器程序中定义的变量,但是集群中运行的每个任务都会得到这些变量的一份新的副本,更新这些副本的值也不会影响驱动...

2018-04-01 19:02:46 25597 17

转载 大数据就业前景

从Amazon GO无人超市的提出,到阿里巴巴无人超市“淘宝会员店”7月9日正式营业,无人零售概念已经进入人们的视野当中。但是呢,这些概念的实现,都与人工智能脱不了关系。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能之所以能取得突飞猛进的进展的背后,不能不说这些年来大数据长足发展的结果。人工智能和大数据有什么关系...

2018-04-01 11:17:34 16477

SparkMLlib机器学习(黄美玲和王晓华版两本)

SparkMLlib机器学习黄美玲版和SparkMLlib机器学习实战王晓华版,都带目录,很方便阅读,希望能帮助到大家

2018-10-17

CDH-5.13.1安装文档

亲测CDH-5.13.1,希望能够帮助想要使用CDH的同学,文档中有不懂的可以留言

2018-09-03

高等数学(同济大学出版)上下册(高清,带目录)

学习人工智能、大数据高数是必备的专业技能,同济大学出版的高等数学一直是很多高校指定的专用教材

2018-04-18

Spark快速大数据分析和深入解析Spark内核架构设计与实现原理

有这两本书,的确可以把spark技术研究透彻,真心感谢这两位作者

2018-03-28

java最经典的笔记

这是我见过java总结的很屌的培训机构的老师,感谢阳哥笔记,让人对java基础的知识有了更加深刻的理解

2018-02-08

搜题功能,图片文字识别技术

模仿作业帮、猿题库等含有搜题功能的app,自定义相机,图片识别技术的实现,超级简单

2018-01-03

Dialog的正确使用方式

学会如何正确使用Dialog,以及更规范的Dialog模板,和创建的方式。

2017-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除