自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 资源 (14)
  • 收藏
  • 关注

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-07-31 10:59:16 641

转载 Scala资料

转载网址:http://www.cnblogs.com/sunddenly/p/4411564.html

2016-07-28 17:21:43 863

原创 深入理解Java中的容器

1、容器的概念 在Java当中,如果有一个类专门用来存放其它类的对象,这个类就叫做容器,或者就叫做集合,集合就是将若干性质相同或相近的类对象组合在一起而形成的一个整体 2、容器与数组的关系 之所以需要容器: 1、数组的长度难以扩充 2、数组中数据的类型必须相同 容器与数组的区别与联系: 1、容器不是数组,不能通过下标的方式访问容器中的元素 2、数组的所有功能通过Arraylist容器

2016-07-27 17:25:40 65256 17

转载 转载:TreeSet详解

网址:http://www.cnblogs.com/ningvsban/archive/2013/05/06/3062535.html

2016-07-26 16:55:51 706

转载 转载:HashMap的实现原理

网址:http://www.cnblogs.com/xwdreamer/archive/2012/06/03/2532832.html

2016-07-26 16:24:00 679

转载 转载:哈希表

转载网址:http://blog.csdn.net/jiajiayouba/article/details/44960579

2016-07-26 09:29:32 606

原创 Hadoop学习闲谈

2016年1月25号开始学习的hadoop,到今天2016年7月22号,到现在满打满算已经6个月了,在学习hadoop这段时间可以感受到自己在很快的进步。 1、通过对hadoop的学习,使我感受到了实战与实践的重要性 2、逻辑思维能力与解决问题的能力是一个程序员必须锻炼的一个本事 3、学习是一个循序渐渐的过程,没有终点而言 4、要学会总结 接下来要学习Spark了,对自己提出以下几点要求:

2016-07-22 17:36:28 838

原创 Hadoop项目实战---黑马论坛日志分析

1、项目描述 通过对黑马技术论坛的apache common日志进行分析, 计算论坛关键指标,供运营者决策。 2、数据情况 每行记录有5部分组成: 1.访问ip 2.访问时间 3.访问资源【跟着两个访问的Url】 4.访问状态 5.本次流量 截取部分数据如下:27.19.74.143 - - [30/May/2013:17:38:21 +0800] "GET /static/im

2016-07-22 15:06:54 12648 10

原创 MySql表链接详解(结合Hadoop中的Hive数据仓库)

在做Hadoop黑马日志分析项目的过程中,进行了表的链接。本篇博客将结合Hive详细说明Mysql表链接。: 1、统计每日的pv(浏览量)hive> create table hmbbs_pv > as select count(1) as pv from hmbbs_table;查看运行结果:hive> describe hmbbs_pv;OKpv bigintTime

2016-07-22 12:13:38 1299

原创 Hive---外部分区表的创建

hive> create external table tv2(id int,name string,sex string) partitioned by(day int) > row format delimited > fields terminated b

2016-07-22 08:59:54 3513

原创 Sqoop---Got exception in update thread: com.mysql.jd bc.exceptions.jdbc4.MySQLSyntaxErrorException

问题:通过sqoop将mysql中的数据导入到hdfs的时候,日志停留在map 100% reduce 0%不动。如下所示:16/07/21 11:46:09 INFO mapreduce.Job: Job job_1469064014798_0012 running in uber mode : false16/07/21 11:46:09 INFO mapreduce.Job: map 0%

2016-07-21 16:28:19 2270

原创 Hadoop学习重点体系结构

1、Hadoop伪分布集群的搭建 2、WordCount程序与FlowCount程序的编写,MapReduce的运行流程 3、MapReduce的3中运行模式 4、Mapreduce中Mapper任务数的分之策略

2016-07-20 18:34:24 1004

原创 linux shell编程入门笔记

shell编程的重要性: 对于hadoop程序员,通常需要熟悉shell编程,因为shell可以非常方便的运行程序代码。 shell文件格式:文件名后缀通常是.sh#!/bin/sh[先指定文件下面用的是哪一个sh]#这里是注释shell中的变量: (1)变量不需要声明,初始化不需要指定类型 (2)变量名称只能有字母、数字、下划线组成,不能使用数字开头 (3)分类: 临时变量

2016-07-20 15:32:19 3007 1

原创 Hadoop在linux系统下的集群时间同步

核心命令:查看linux的系统时间: date设置linux的系统时间: date --set=string查看linux的硬件时钟: hwclock将硬件时钟与系统时钟同步:hwclock --hctosys 其中--hctosys表示Hardware Clock to SYStem clock基础知识: Linux将时钟分为系统时钟(System Clock)和硬件(Real Ti

2016-07-19 11:01:04 3152

转载 linux修改系统时间

两步 (1)date 042612492005 (2)hwclock -w 第一步的意思是设置时间,设置完了可以用date命令查看对不对…注意是月日时分年 第二步的意思是写入主板的rtc芯片..

2016-07-19 09:51:48 901

原创 Linux--Date命令详解

date命令的帮助信息 [root@localhost source]# date –help 用法:date [选项]… [+格式]  或:date [-u|–utc|–universal] [MMDDhhmm[[CC]YY][.ss]] 以给定的格式显示当前时间,或是设置系统日期。-d,–date=字符串 显示指定字符串所描述的时间,而非当前时间 -f,

2016-07-19 08:23:47 1063

原创 Hbase调试时遇到的问题总结

问题1:在hbase中不能创建表,并抛出异常: ERROR: Can’t get master address from ZooKeeper; znode data == null 解决措施: (1)停止所有服务,只看到有jps (2)删除掉所有zk节点的/data/zookeeper的version-2目录和文件,只保留myid文件。 (3)删除掉所有hadoop节点的tmp和logs目录

2016-07-18 10:24:26 1717

原创 如何利用MapReduce的分治策略提高KNN算法的运行速度

集群环境介绍:hadoop2.4.1 64位6台服务器:hadoop11 NameNode 、SecondaryNameNodehadoop22 ResourceManagerhadoop33 DataNode、NodeManagerhadoop44 DataNode、NodeManagerhadoop55 DataNode、NodeManagerhadoop66

2016-07-17 21:17:50 5463

原创 Hadoop2.0集群、Hbase集群、Zookeeper集群、Hive工具、Sqoop工具、Flume工具搭建总结

实验开发环境所用软件:[root@hadoop11 local]# lltotal 320576-rw-r--r-- 1 root root 52550402 Mar 6 10:34 apache-flume-1.6.0-bin.tar.gzdrwxr-xr-x 7 root root 4096 Jul 15 10:46 flumedrwxr-xr-x. 11 root

2016-07-15 13:32:46 4638

原创 Exception in thread “main” java.lang.IncompatibleClassChangeError: Found interface org.apache.hadoop

今天用sqoop从mysql数据库向hdfs中导入数据时,抛出下列异常:Exception in thread “main” java.lang.IncompatibleClassChangeError: Found interface org.apache.hadoop.mapreduce.JobContext, but class was expected?原因:sqoop的版本与hadoop的

2016-07-15 10:36:04 1942

原创 mysql jdbc在hive中没有安装导致的两个问题

问题–hive操作的时候抛出异常:hive> show databases;FAILED: Error in metadata: javax.jdo.JDOFatalInternalException: Error creating transactional connection factoryNestedThrowables:java.lang.reflect.InvocationTarg

2016-07-14 21:41:35 1084

原创 Plugin 'FEDERATED' is disabled. /usr/sbin/mysqld: Table 'mysql.plugin' doesn't exist

问题:在linux上安装mysql的时候出现Plugin ‘FEDERATED’ is disabled. /usr/sbin/mysqld: Table ‘mysql.plugin’ doesn’t exist问题。[root@hadoop11 mysql]# more hadoop11.err160714 14:51:30 mysqld_safe Starting mysqld daemon

2016-07-14 20:51:37 12576 1

转载 linux 安装rpm包时遇到error:Failed dependencies解法方法

转载网址:http://blog.sina.com.cn/s/blog_80b4fe5c01018sgr.html

2016-07-14 14:24:49 2924

原创 HBase Shell输入命令无法删除问题的解决技巧

问题:通过SecureCRT对hbase进行shell操作时,命令行无法删除。 解决方案: 问题得到解决!

2016-07-14 08:52:06 1346

转载 Hadoop与之对应的Hbase版本问题

转载网址:http://blog.csdn.net/caoshichaocaoshichao/article/details/13096279

2016-07-13 18:47:38 917

原创 针对例会中出现的split块的位置问题的解决方案

本文作者:王婷婷 针对例会中出现的问题,本人提出的解决方案如下: 涉及到的具体技术实现细节包括hdfs fsck机制与脚本批量执行机制,先分别介绍。 1、hdfs fsck机制 在HDFS中,提供了fsck命令,用于检查HDFS上文件和目录的健康状态、获取文件的block块信息和位置信息等。 集群情况:[root@hadoop11 local]# jps28234 N

2016-07-10 19:19:34 1035

原创 基于Yarn平台的MapReduce运行机制

基于Yarn平台的MapReduce运行机制如下图所示: 详细步骤: 1>用户向yarn平台提交应用程序 2>yarn平台的ResourceManager接收到我们客户端提交给的MapReduce程序后,把程序交给某个NodeManager节点,随后在这个NodeManager节点上启动一个进程— MRAppMaster 3>MRAppMaster首先向ResourceManager注册

2016-07-08 19:17:05 1172

原创 Hadoop中的自定义数据类型(序列化、反序列化机制)详解

大家都知道,Hadoop中为Key的数据类型必须实现WritableComparable接口,而Value的数据类型只需要实现Writable接口即可;能做Key的一定可以做Value,能做Value的未必能做Key.但是具体应该怎么应用呢?—-本篇文章将结合手机上网流量业务进行分析。 先介绍一下业务场景:统计每个用户的上行流量和,下行流量和,以及总流量和。 本次描述所用数据: 日志格式描述:

2016-07-07 15:18:06 3042

原创 基于MapReduce的手机上网流量统计分析

Hadoop简介:适合大数据的分布式存储与计算平台。 运行在Hadoop之上的大型服务器集群: 数据情况:(摘取部分) 字段描述:时间戳、手机号码、AP mac、AP mac、访问的网址、网址种类、上行数据包、下行数据包、流量、访问状态。 手机上网流量统计结果:(先展示统计部分结果) MapReduce程序开发步骤: 1、maper函数的编写 2、reducer函数的编写

2016-07-06 21:11:17 5917 7

原创 Hadoop开发----经验总结3

之前在Hadoop的开发过程中,一直犯了一个比较严重的错误:一直将windows下的hadoop的本地运行模式理解为hadoop的集群运行模式,现将Hadoop的运行模式总结如下: 1、独立模式即本地运行模式(standalone或local mode) 无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。由于在本机模式下测试和调试MapReduce程序较为方便,因此,这种模式

2016-07-05 21:40:30 1242

原创 MapReduce程序的3种集群提交运行模式详解---基于Windows与Linux两种开发环境

继上一篇博客—-Hadoop本地运行模式深入理解,本篇文章将详细介绍在基于Windows与Linux两种开发环境下,MapReduce程序的3种集群运行方式。在通篇文章中,仍然以经典的WordCount程序为例进行说明,以提高文章的易读性,下面进入文章的正题。 (1)MapReduce程序的集群运行模式1—将工程打成jar包,上传到服务器,然后用hadoop命令hadoop jar xxx.

2016-07-05 20:57:48 5385 1

原创 Hadoop本地运行模式深入理解

Hadoop的运行模式分为3种:本地运行模式,伪分布运行模式,集群运行模式,相应概念如下: 1、独立模式即本地运行模式(standalone或local mode) 无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。由于在本机模式下测试和调试MapReduce程序较为方便,因此,这种模式适宜用在开发阶段。 2、伪分布运行模式 伪分布:如果Hadoop对应的Java进程都运行

2016-07-04 16:35:05 15291 1

原创 软件大全下载整理(更新中)

本篇文章将整理在开发过程中所用的各种软件,并会陆续的进行更新!

2016-07-03 10:28:38 2647 1

原创 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-

集群环境:hadoop2.4.1 问题描述: 在执行hadoop fs -ls / 时,显示:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin- ,从问题上可以看出,不能够加载本地库。 原因分析: 查看linux系统的的位数:[r

2016-07-02 16:40:46 926

原创 java.lang.NoSuchMethodException: MapReduce.WordCount$MyMapper.<init>()

今天在YARN平台上测试了一个程序–wordcount:package MapReduce;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import o

2016-07-02 09:51:02 3861

原创 Wrong FS: hdfs://hadoop20:9000/word.txt, expected: file:///---异常解决方案

今天搭建了一个hadoop2.0(yarn集群平台),首先在上面测试了一个FileSystem实例程序,代码如下:package IT0701;import java.io.IOException;import java.net.URISyntaxException;import org.apache.commons.compress.utils.IOUtils;import org.apach

2016-07-01 20:42:20 4261 1

转载 Resources are low on NN. Please add or free up more resources then turn off safe mode manually.

问题解决方案的转载网址: http://www.chinahadoop.cn/classroom/5/thread/189 http://jingyan.baidu.com/article/3aed632e198ae870108091b4.html

2016-07-01 16:23:37 7744

原创 SecureCRT远程连接Linux---终端中文字符出现乱码的解决方式

今天用SecureCRT远程连接linux时,发现终端中的中文字符总是出现乱码的现象,如下所示: 首先我先查看了一下LANG这个参数:[root@hadoop22 ~]# echo $LANGen_US.UTF_8可以看出LANG这个参数是正常的。 随后我又查看了一下/etc/sysconfig/i18n这个配置文件的内容:[root@hadoop22 sysconfig]# more i

2016-07-01 13:11:48 18494 4

flink-1.7.2-bin-hadoop27-scala_2.12.tgz

flink-1.7.2-bin-hadoop27-scala_2.12.tgz

2020-07-19

flink-1.7.2-bin-hadoop27-scala_2.11.tgz

flink-1.7.2-bin-hadoop27-scala_2.11.tgz

2020-07-19

jdk-8u131-windows-i586.zip

jdk-8u131-windows-i586.exe

2020-05-02

Postman-win64-6.5.2-Setup.exe.7z.zip

postman 压缩包。安装即可使用,支持在线请求

2020-05-02

scala-2.11.8.msi.zip

Scala是一门多范式的编程语言,一种类似java的编程语言,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。

2020-05-02

plugins_2.zip

Notepad++插件集合大全

2020-05-02

大数据全套视频2018.zip

内含全套大数据视频,我也是看这个学习的,大家有什么不懂的可以相互交流!徐老师(视频中)讲的课非常好,当初学习java就是靠着它对这门语言有了深刻的认识。

2020-05-02

BookmarkSidebar(书签侧边栏插件)v1.9.0Chrome版.rar.zip

Bookmark Sidebar是款简单实用的浏览器辅助插件。它可以帮助用户打造一个精美侧边栏,里面主要用于放置你所保存的所有书签。有喜欢的用户不要错过了。

2020-05-02

oCam录屏软件.zip

cCam录屏软件是一个免安装,不占内存的电脑屏幕录制工具,非常轻量级。直接点击cCam.exe文件即可录制屏幕。非常好用。不卡顿。

2020-05-02

批量工具管理

批量工具管理

2017-07-15

Hadoop2.0开发环境搭建

涉及到了Hadoop2.0、Hbase、Sqoop、Flume、Hive、Zookeeper的具体环境搭建

2016-07-15

Hadoop 2.2 Windows下需要的 winutils.exe

Hadoop 2.2 Windows下eclipse开发hadoop程序会报错,原因是因为hadoop2.2没有发布winutils.exe造成的,现编译发布出来; 把此文件放到hadoop/bin下,在环境变量中配置 HADOOP_HOME 即可。 ERROR [main] util.Shell (Shell.java:getWinUtilsPath(303)) - Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

2016-06-29

基于哈希技术与MapReduce的大数据集K-近邻算法实现代码

基于哈希技术和MapReduce的大数据集K-近邻算法实现代码

2016-05-06

基于哈希技术和MapReduce的大数据集K-近邻算法实现代码

基于哈希技术和MapReduce的大数据集K-近邻算法实现的完整代码

2016-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除