- 博客(10)
- 资源 (11)
- 收藏
- 关注
原创 Flume
FlumeFlume介绍概述Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多的外部存储系统中。一般的采集需求,通过对flume的简单配置即可实现Flume针对特殊的场景也具有良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景
2017-12-20 21:42:09 364
原创 SpringMVC中一个请求的经历过程
SpringMVC中一个请求的经历过程浏览器发起请求,请求中包含请求的UEL和一些其他信息。请求首先到达DispathckerServlet.DispatcherServlet查询一个或者多个处理器映射来确定下一站在哪里。处理器映射会根据请求所携带的URL信息来进行决策。确定了合适的控制器之后,DispatcherServlet将请求发送给选中的控制器。控制器将要返回给用户的信息打包 ,并且
2017-12-20 19:52:49 614
原创 mapreduce实践篇
mapreduce实践篇MAPREDUCE实例编写及编码规范编程规范用户编写的程序分成三个部分:Mapper,Reducer,Driver(提交 运行mr程序的客户端)Mapper的输入数据是KV对的形式(KV类型可以自定义)Mapper的输出数据是KV对的形式(KV的类型可自定义)Mapper中的业务逻辑写在map()方法中map()方法(maptask进程)对每一个一个简单的Mapre
2017-12-20 18:12:51 688
原创 SQL Server安全管理
SQL Server安全管理数据库的安全性是指保护数据以防止因不合法的使用而造成的数据的泄密和破坏SQL Server的安全性机制SQL Server的安全体系结构可以划分为以下4个层次:客户操作系统的安全性 在使用客户计算机通过网络实现对SQL Server服务器的访问时,用户首先要获得计算机操作系统的使用权限。SQL server的服务器安全性 SQL Server服务器安全性建立在控
2017-12-19 15:29:42 4682
原创 HIVE详解
HIVE详解HIVE基本概念HIVE简介什么是hive?hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。为什么使用Hive直接使用hadoop所面临的问题: 人员学习成本太高 项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大为什么使用HIve 操作接口采用类SQL语法,提供快速开发的能力 避
2017-12-19 13:28:01 1658
原创 Zookeeper入门笔记
Zookeeper入门笔记Zookeeper概念简介zookeeper是一个分布式协调服务;就是为用户的分布式应用程序提供协调服务。A.zookeeper是为别的分布式程序服务的B.zookeeper本身就是一个分布式程序(只要有半数以上节点存活,zk就能正常服务)C.Zookeeper所提供的服务涵盖:主从协调,服务器节点动态上下线、统一配置管理、分布式共享锁、统一名称服务。。D.虽说可以提供各种
2017-12-16 22:27:01 375
原创 关于使用虚拟机克隆后eth0见的问题
直接修改 /etc/sysconfig/network-script/ifcfg-eth0 删掉UUID HWADDR 配置静态地址 然后: rm -rf /etc/udev/rules.d/70-persistent-net.rules 然后 reboot
2017-12-15 14:28:53 276
原创 YUM本地源制作
YUM本地源制作1.准备一台Linux服务器,用最简单的版本CentOS-6.7-x86_64-minimal.iso2.配置好这台服务器的IP地址3.上传CentOS-6.7-x86_64-bin-DVD1.iso到服务器4.将CentOS-6.7-x86_64-bin-DVD1.iso镜像挂载到某个目录mkdir /var/isomount -o loop CentOS-6.7-x86_64-b
2017-12-15 14:27:13 297
原创 hadoop-mapreduce原理篇
MAPREDUCE原理篇mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上。分为三块:MRAppMaster(mapreduce application master)/MapTask/Reduce TaskMAPR
2017-12-08 21:26:20 338
原创 hadoop--hdfs入门讲解
HDFS基本概念篇HDFS前言设计思想: 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析:在大数据系统中的运用: 为各类分布式运算框架提供数据存储服务。重点概念:文件切块,副本存放,元数据HDFS概念和特性重要特性:采用分块存储HDFS文件系统会给客户端提供一个统一的抽象目录树,客户端通过目录来访问文件。目录结构及文件分块信息(元
2017-12-05 21:00:10 482
j2EE核心模式
2017-09-26
Struts2权威指南
2017-09-26
Struts2技术内幕
2017-09-26
MySQL必知必会
2017-09-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人