自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 hadoop收集的文章

Hadoop入门 单节点的安装与测试1 下载hadoop的相应版本2 设置conf目录下的hadoop-env.sh文件,最低要求是要配置JAVA_HOME这个环境变量3 设置conf目录下的hadoop-site.xml配置文件,fs.default.namelocalhost:9000mapred.job.trackerlocalhost:9001dfs.replication14 配置本

2007-10-08 21:58:00 1674 1

转载 Crawl the Nutch -- Map Reduce

 初见于Google Lab的Paper, http://labs.google.com/papers/mapreduce.html,论文中表明在有大量集群支撑的情况下,可以快速的在海量文档中进行数据处理。现在你有一堆数据,你需要按记录修改、查询、插入和删除,一种办法是你为这些记录建立索引,比如放入数据库,还有一种办法就是--MapReduce。这种处理方式实际上是在数据存放的时候不建立索引,等实

2007-09-26 15:02:00 1257

转载 怎样用JspSmartUpload实现文件上传攻略

 ㈠ 表单要求  对于上传文件的FORM表单,有两个要求:  1、METHOD应用POST,即METHOD="POST"。  2、增加属性:ENCTYPE="multipart/form-data"  下面是一个用于上传文件的FORM表单的例子: FORM METHOD="POST" ENCTYPE="multipart/form-data" ACT

2007-09-14 21:26:00 1285

转载 MapReduce介绍(转载自张凌云Blog)

MapReduce:超大机群上的简单数据处理                                                                               摘要MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个

2007-09-11 09:51:00 2490 1

转载 基于Lucene站内搜索(转载)

 99收藏夹原来的站内收藏搜索是基于数据库的like%%语句,发现速度有点慢,于是想到用Lucene来实现站内收藏的按名字和共享收藏的连接标题来搜索的功能,昨天下午做好了,但是结果有点牵强人意。首先我用Lucene把数据从数据库导出建立索引,代码如下,注:里面的ChinaTokene方法是调用www.sj110.com的中文分词组件 public class IntranetInd

2007-09-04 10:26:00 1041

转载 搜索篇:lucene简单实例 (二) 转自javaeye

Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有Standar

2007-09-03 19:43:00 826

原创 Blue

 I am not sure how much longer I can hang on.

2007-08-30 00:51:00 1308

原创 氧化钙Jbuilder2006

一点都不好用 ...虽然我有点酸葡萄心理...

2007-08-28 21:05:00 747

原创 TreeView

import java.awt.Dimension;import java.awt.Color;import javax.swing.JFrame;import javax.swing.JPanel;import javax.swing.JScrollPane;import javax.swing.BoxLayout;import javax.swing.tree.*;import javax

2007-08-27 21:23:00 540

原创 开博了

     大自然是无为的,连续的。人的思维、语言文字就是在努力把这些自然发生的东西用所谓的真理、规律固定下来,数字化只是对自然的无限接近的再现,却永远不是自然。   人的意识本是自然的活动,是道,是无形的,一但有形,可以重复,就形成了思维,用语言、文字数字化,虽然利于流传,但只是对原意的拟合。 1、如前人的信息量为a;后人的信息量为b  后人首先是要学习前人的知识经验  如果b>a

2007-08-27 15:29:00 406

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除