自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (6)
  • 收藏
  • 关注

原创 大数据学习篇:hadoop深入浅出系列之HDFS(七) ——小文件解决方案

小文件指的是那些size比HDFS的block size(默认128M)小的多的文件。任何一个文件,目录和block,在HDFS中都会被表示为一个object存储在namenode的内存中,每一个object占用150 bytes的内存空间。所以,如果有10million个文件,每一个文件对应一个block,那么就将要消耗namenode 3G的内存来保存这些block的信息。如果规模再大

2015-09-30 14:24:15 1169 1

原创 大数据学习篇:hadoop深入浅出系列之HDFS(六) ——JavaAPI操作

前面我们讲了hadoop的httpFS访问,今天讲hadoop的第三种访问方式:JavaAPI

2015-09-28 22:33:38 1136

原创 大数据学习篇:hadoop深入浅出系列之HDFS(五) ——httpFS访问

前面我们讲了HDFS的shell操作,今天讲的是HDFS的httpFS访问,由于还没有研究透彻,先立个文章放这,以后编辑文件httpfs-env.sh执行sbin/httpfs.sh执行命令curl -i "http://192.168.1.213:14000/webhdfs/v1?user.name=root&op=LISTSTATUS"更多命令参考http://hado

2015-09-26 12:13:00 1983

原创 大数据学习篇:hadoop深入浅出系列之HDFS(四)——shell操作

上一篇我们讲了HDFS的读文件和写文件,今天我们来讲HDFS的shell操作。首先,我们进入到hadoop文件夹下,然后输入bin/hdfs命令,我们能发现有很多提示信息,Usage: hdfs [--config confdir] COMMAND       where COMMAND is one of 这句话的大致意思就是说hdfs后面要跟命令,我们之前格式化namenode执行的命

2015-09-25 23:33:48 1185 3

原创 大数据学习篇:hadoop深入浅出系列之HDFS(三) ——HDFS读文件和写文件

上一篇讲了HDFS的体系结构,今天这篇,我们来讲讲HDFS的读和写。一:读文件1.首先调用FileSystem对象的open方法,其实是一个DistributedFileSystem的实例2.DistributedFileSystem通过rpc获得文件的第一批个block的locations,同一block按照重复数会返回多个locations,这些locations按照hadoo

2015-09-23 00:03:43 1456 1

原创 大数据学习篇:hadoop深入浅出系列之HDFS(二)——HDFS体系结构

上一篇文章,我们说了HDFS的简介和优缺点,这篇文章我们来探讨下HDFS的体系结构先上一张美图供大家欣赏。通过这张图,我们可以清晰的看到HDFS的体系结构,client,NameNode,DataNode等,进入到hdf文件下也可以看到几个对应的文件夹(如下图)这个路径是可变的,具体查看配置文件hdfs-site.xml中dfs.namenode.name.dir和dfs.

2015-09-22 01:11:23 1599

原创 关于textarea中回车保存和显示

最近做项目的时候,发现textarea文本中有敲了换行符,保存之后,点击查看按钮居然显示不了,页面也不报错,用了调试程序发现,前台获取的居然是几行数值,然后又去了数据库,发现数值一行显示。于是纳闷了。或许前端框架不支持吧,此处就要自己修改了我的做法如下首先保存的时候java代码进行修改

2015-09-21 15:34:03 5814

原创 大数据学习篇:hadoop深入浅出系列之HDFS(一)——HDFS简介和优缺点

上一篇,我们说了hadoop的伪分布式安装,今天我们来说说著名的HDFSHDFS,顾名思义 Hadoop Distributed File System,至于它的来历我就不说了,网上比比皆是。随着数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 。

2015-09-20 23:24:49 5353 1

原创 linux系统下ESC键失效

程序员难免要跟linux系统打交道,可能某些原因,导致ESC键坏掉,那么之前编辑的内容要付之一炬了吗,岂不是很痛心,其实未必,用  CTRL+[  组合键,完美替代,手还不需要离开键盘,perfect!

2015-09-18 10:49:42 9000

小程序样式.rar

比较好看的小程序样式,在小程序项目中使用了之后效果就非常的好,会在如下项目:https://blog.csdn.net/stronglyh/article/details/93233103 中使用

2019-06-21

hadoop权威指南第四版中英双文

hadoop权威指南中的第四版是非常新,非常全的一个版本

2019-01-07

spark零基础入门路线指导

同过对本书的阅读,spark变牛逼,指日可待!认真学习吧

2018-04-27

spark自定义分区

spark的内容很多,这个pdf主要是spark自定义分区部分内容讲解,

2017-12-08

highChartsjs

它就是著名的highChartsjs,饼状图、柱状图

2015-11-25

windows版本的redis-2.8

这是windows版本的redis资源,完全可用,绝不坑人,希望大家都能用起来。祝大家工作愉快。

2015-07-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除