自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

mingyuan's workspace

点滴记录我的学习历程...

  • 博客(7)
  • 资源 (8)
  • 问答 (1)
  • 收藏
  • 关注

原创 远程拷贝命令――scp

1、文件拷贝$scp filename1.txt user@remotehost:/path/to/destination之后会提示输入user在remotehost上的密码,确认之后就开始拷贝。2、目录拷贝$scp -r directoryname user@remotehost:/path/to/destination同样需要输入密码,确认之后开始拷贝

2009-12-10 22:54:00 645

原创 4.Hadoop I/O

原稿发布在我另外一个博客http://hadoopforcloud.javaeye.com4. Hadoop I/O4.1. Data Integrity 数据完整性 一般使用checksum检查数据的完整性,但是他仅能检查完整性,而不提供任何的修复办法,checksum的值也有出错的可能。 Hadoop采取了不同策略的checksum来克服以上的不足 4.1.1. Data Integrity

2009-12-10 22:21:00 1386

原创 3.The Hadoop Distributed File System

原稿发布在我另外一个博客:原稿发布在我另外一个博客http://hadoopforcloud.javaeye.com3. The Design of HDFS HDFS设计的针对对象:适合流式访问的超大文件、在使用便宜的硬件搭建的集群上运行。 HDFS不足: 低延迟数据访问(Hbase是个好选择)、小文件多的时候出现问题(HDFS将文件Meta信息存储在内存中,内存限制了可以控制的文件数量)、对文

2009-12-10 22:17:00 947

原创 Nutch分布式检索配置

Nutch版本:0.7.2,也适用于1.01、 同样Nutch程序分发在N台服务器上2、 在一台服务器上部署tomcat,修改其中nutch-site.xml,将search.dir指向包含search-servers.txt的目录3、 search-servers.txt目录中存放运行nutch服务的服务器ip及其监听端口4、 启动各个nutch server。server [port] /pa

2009-12-09 18:11:00 768 4

原创 linux下面tar gzip zip bzip使用指南

转自:http://www.ixdba.net/article/b2/515.htmltarlinux下面的归档工具。是对文件或者目录进行归档,归成一个文件,但并不压缩。语法格式tar [主选项+辅选项] 文件或者目录列表 主选项-c 创建新的档案文件-r 把要归档的文件追加到档案文件的末尾IXDBA.NET技术社区-t 列出档案文件中已经归档的文件列表-u 更新文件,用新文件替代档案中原始文件

2009-12-02 16:00:00 719

原创 2.MapReduce

2. MapReduce 2.1. A Weather Dataset 一个天气数据集 数据是NCDC的数据,我们关注以下特点: 1) 数据是半格式化的 2) 目录里面存放的是从1901-2001年一个世纪的记录,是gzip压缩过的文件。 3) 以行为单位,使用ASCII格式存储,每行就是一条记录 4) 每条记录我们关注一些基本的元素,比如温度,这些数据在每条数据中都会出现,并且宽度也

2009-12-01 23:11:00 1166

原创 1. Meet Hadoop

1. Meet Hadoop 1.1. Data 数据 本节陈述了这样的事实:数据量越来越大,并且来源也越来越多,我们面临的问题是如何有效的存储和分析它们。 1.2. Data Storage and Analysis 数据存储和分析 现在面临这这样的一个问题:当磁盘的存储量随着时间的推移越来越大的时候,对磁盘上的数据的读取速度却没有多大的增长。 读取硬盘上的全部数据会花费比较长的时间,如果是写操

2009-12-01 23:10:00 721

C++ Boost Thread 编程指南

C++ Boost Thread 编程指南 pdf整理版

2009-09-10

MSXML6.0 SDK

安装之后文档在C:\Program Files\MSXML 6.0\Docs目录 不想在此下载的可到如下地址下载: http://www.microsoft.com/downloads/details.aspx?FamilyID=993c0bcf-3bcf-4009-be21-27e85e1857b1&displaylang=en

2009-08-30

计算机程序设计技巧,第一卷:算法

计算机程序设计技巧,第一卷:算法 pdf格式

2009-08-27

linux命令详解

linux的命令详解

2008-04-20

linux命令详解

linux的命令详解

2008-04-20

Linux - Teach Yourself Shell Programming in 24 Hours

Linux - Teach Yourself Shell Programming in 24 Hours

2008-04-20

面向对象软件工程的软件过程改进

介绍了软件工程、面向对象技术、统一建模语言UML 等概念,分析了以往软件开发过程中存在的弊端,阐述了统一软件过程在现今软件开发中的作用.

2008-03-24

RUP_BestPractics_Chinese(统一开发过程)

rational统一开发软件开发队伍的最佳实践

2008-03-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除