2015年07月_andrewgb

12月 11月 10月 09月 08月 07月 06月 04月 03月

原创 Hadoop 分布式安装过程简述

1.实验分布结构：节点责任描述主节点（1个，主机名hadoop） NameNode、JobTracker、SecondaryNameNode 从节点（2个，主机名hadoop1、hadoop2） DataNode、TaskTracker主机名的配置：[root@hadoop2 ~]# vi /etc/sysconfig/networkps：编辑此文件：HOSTNAME=

2015-07-15 00:40:39 1164

原创 hadoop 在搭建分布式时遇到DataNode,NameNode,JobTracker,TaskTracker用jps查看无法启动解决办法

搭建分布式hadoop时遇到节点某些进程无法启动时的一些解决方案

2015-07-14 23:47:48 1102

原创配置SSH时遇到 "Host key verification failed." 的解决方案

SSH遇到 Host key verification failed 时的解决方案，有两种方法

2015-07-12 23:47:58 5437 1

原创 Linux 查看IP、查看Gateway、查看DNS

ip,gateway,dns的查看

2015-07-12 20:55:18 2282

原创 Linux 系统扫描技术及安全防范之 nmap（批量主机服务扫描命令）

namp的使用和扫描类型

2015-07-12 00:12:09 1001

简介一般在windows 来判断网络连通性用ping 和tracert,ping的话可以来判断丢包率，tracert可以用来跟踪路由，在Linux中有一个更好的网络连通性判断工具，它可以结合ping nslookup tracert 来判断网络的相关特性,这个命令就是mtr使用举例[root@hadoop ~]# mtr -husage: mtr [-hvrctglspni46] [--help]

2015-07-11 22:36:23 619

原创 Linux 系统扫描技术及安全防范之 traceroute

traceroute的工作原理traceroute，也就是 trace route，跟踪路由。这个程序最早是Van Jacobson实现的。主要的原理是IP路由过程中对数据包TTL(Time to Live，存活时间)的处理。当路由器收到一个IP包时，会修改IP包的TTL（及由此造成的头部检验和checksum变化）。每收到一个包，检查这个的TTL是否是0或1。如果是，表明这个包还没有到达目的地

2015-07-11 22:16:38 1400

原创 Linux 系统扫描技术及安全防范之 fping

获取安装包到fping的官方网站（http://fping.org）获取fping的安装包[hadoop@hadoop Desktop]$ wget http://fping.org/dist/fping-3.10.tar.gz安装软件包1 .解压 [hadoop@hadoop Desktop]$ tar -xvf fping-3.10.tar.gz 2.安装[hadoop@hadoop

2015-07-11 20:05:18 537

原创 Hadoop 之 WritableComparable 接口

Writable接口和WriteableComparable接口的阐述和详细举例

2015-07-10 21:30:09 641

原创 Hadoop 之 Shuffle

1.每个map有一个环形内存缓冲区，用于存储任务的输出。默认大小100MB（io.sort.mb属性），一旦达到阀值0.8（io.sort.spill.percent）,一个后台线程把内容写到(spill)磁盘的指定目录（mapred.local.dir）下的新建的一个溢出写文件。2.写磁盘前，要partition,sort。如果有combiner，combine排序后数据。3.等最后记录

2015-07-08 23:24:21 423

原创 Hadoop自定义计数器的使用

定义：hadoop计数器:可以让开发人员以全局的视角来审查程序的运行情况以及各项指标，及时做出错误诊断并进行相应处理。内置计数器（MapReduce相关、文件系统相关和作业调度相关）例子：（内置计数器） Counters: 19 File Output Format Counters

2015-07-01 23:04:13 1079

原创堆和栈

Java把内存划分成两种：一种是栈内存，一种是堆内存。在函数中定义的一些基本类型的变量和对象的引用变量都在函数的栈内存中分配。当在一段代码块定义一个变量时，Java就在栈中为这个变量分配内存空间，当超过变量的作用域后，Java会自动释放掉为该变量所分配的内存空间，该内存空间可以立即被另作他用。堆内存用来存放由new创建的对象和数

2015-07-01 22:59:09 305

原创 HADOOP之MAPREDUCE

摘要：MapReduce是Hadoop的又一核心模块，从MapReduce是什么，MapReduce能做什么以及MapReduce的工作机制三方面认识MapReduce。关键词：Hadoop MapReduce 分布式处理面对大数据，大数据的存储和处理，就好比一个人的左右手，显得尤为重要。Hadoop比较适合解决大数据问题，很大程度上依赖其大数据存储系统，即HDFS和大

2015-07-01 22:55:27 294

原创 HADOOP之HDFS

摘要：HDFS是Hadoop的核心模块之一，围绕HDFS是什么、HDFS的设计思想和HDFS的体系结构三方面来介绍。关键词：Hadoop HDFS 分布式存储系统HDFS是Hadoop的核心模块之一，HDFS是什么？它是Hadoop分布式文件系统（Hadoop Distributed File System），摘录Apache 组织关于HDFS的介绍“The Hadoop D

2015-07-01 22:52:20 716

原创 HADOOP之HDFS文件操作

摘要：Hadoop之HDFS文件操作常有两种方式，命令行方式和JavaAPI方式。本文介绍如何利用这两种方式对HDFS文件进行操作。关键词：HDFS文件命令行 Java APIHDFS是一种分布式文件系统，为MapReduce这种框架下的海量数据分布式处理而设计。Hadoop之HDFS文件操作常有两种方式，一种是命令行方式，即Hadoop提供了一套与Linu

2015-07-01 22:48:32 465

原创 MapReduce在运行时接受命令行参数

MapReduce在运行时可以接受命令行参数

2015-07-01 22:43:55 733

2007~2014年同等学历计算机综合真题及部分答案解析

包含2007年到2014年的考题以及部分答案解析，内容手工整理，实属不易，请珍惜

2018-03-12

MySQL 远程连接后建表问题

2015-08-15

Hadoop分布式搭建时，在主节点JPS找不到JobTracker进程

2015-07-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Andrew的成长之路