自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Now . Or Never ``

if you stay , you will always here.

  • 博客(10)
  • 资源 (8)
  • 收藏
  • 关注

原创

<br />每个人都梦想着成功,恰巧,我也作为人类的一员。<br />程序员都希望能涅槃重生,恰巧,我也作为编程者之一。<br />走入这个行业,其实也很靠缘分的。毕竟, 自己没有做别的行业。或者,自己做不了别的行业?不善于欺骗的人,才能做逻辑,正直的程序员吧。<br />但是,程序员有太多,太多。<br />我所见到的几个貌似牛人。都是在三十出头的时候,会很多的语言。c  c++ c# Delphi java 等等等等,基本都是这样,多面手,什么都能做,而在一门上,会比较精通。那么,我26, 又怎么才能在

2010-06-17 19:21:00 808

转载 Nutch1.0 crawl分析(转)

<br /><br />源自:http://jlife.javaeye.com/blog/478315<br />关键字:nutch-1.0中,org.apache.nutch.crawl.crawl类中提供了一个入口主函数main,通过接收<br /> <br />================================================================ <br />Crawler和Searcher两部分被尽是分开,其主要目的是为了使两个部分可以布地配置在

2010-06-22 11:54:00 731

转载 Nutch1.0 crawl分析(转)

<br /><br />源自:http://jlife.javaeye.com/blog/478315<br />关键字:nutch-1.0中,org.apache.nutch.crawl.crawl类中提供了一个入口主函数main,通过接收<br /> <br />================================================================ <br />Crawler和Searcher两部分被尽是分开,其主要目的是为了使两个部分可以布地配置在

2010-06-22 11:53:00 575

转载 Nutch1.0 crawl分析(转)

<br /><br />源自:http://jlife.javaeye.com/blog/478315<br />关键字:nutch-1.0中,org.apache.nutch.crawl.crawl类中提供了一个入口主函数main,通过接收<br /> <br />================================================================ <br />Crawler和Searcher两部分被尽是分开,其主要目的是为了使两个部分可以布地配置在

2010-06-22 11:53:00 610

转载 Nutch1.0 日志分析(转)

<br /><br />Hadoop集群创建文件<br />[nutch@gc01vm13 /]$ cd ./home/nutch/nutchinstall/nutch-1.0/<br />[nutch@gc01vm13 nutch-1.0]$ bin/hadoop fs -ls<br />Found 1 items<br />drwxr-xr-x   - nutch supergroup          0 2010-06-09 20:10 /user/nutch/zklin<br />[nutc

2010-06-22 09:20:00 1375

转载 在Eclipse下配置nutch1.0 及1.1

<br /><1>: 首先从http://apache.etoak.com/lucene/nutch/  下载最新的nutch.在这里我使用的是nutch1.0.<br /><2>: 在eclipse中新建立一个Java Project. 名字自己定义(Nutch). 选择"Create project from existing source",指向自己nutch-1.0的目录.<br /><3>: 点击下一步,切换到"Libraries"选择"Add Class Folder..." 按钮,从列表中选择

2010-06-21 11:07:00 1471

原创 爬虫crawler和查询searcher

<br /><br />Nutch主要分为两个部分:爬虫crawler和查询searcher。Crawler主要用于从网络上抓取网页并为这些网页建立索引。Searcher主要利用这些索引检索用户的查找关键词来产生查找结果。两者之间的接口是索引,所以除去索引部分,两者之间的耦合度很低。<br />  <br />Crawler和Searcher两部分尽量分开的目的主要是为了使两部分可以分布式配置在硬件平台上,例如将Crawler和Searcher分别放在两个主机上,这样可以提升性能。<br />爬虫,Craw

2010-06-01 23:22:00 777

转载 Nutch 1.0 Fetcher 抓取模型解析

<br /><br />1. 介绍<br />2. 抓取流程分析<br />3. 结束<br />---------------<br />1. 介绍<br />   Nutch是apache Lucene的一个子项目,它主要用来进行网页数据的收集和索引。它用结合apache的Hadoop和Lucene等子项目。Nutch的一般抓取流程如下:<br />   1. 把初始网址inject到crawlDb中进行准备抓取<br />   2. 用generate模块对crawlDb中的网址进行过滤<br /> 

2010-06-01 23:15:00 1258

转载 搜索引擎的原理简介

<br /><br />一、搜索引擎的原理简介<br />1.一个抓网络页面程序<br />  把www中的各网站的内容抓到本地<br />2.一个文件解析工具<br />  把抓下来的html、doc等源文件处理为更精确的格式文本<br />3.一个全文检索、分词、数据挖掘,解析文本,把数据抓到结构化数据库中<br />  可以采取工具软件,未必要自己写。数据库可以是文件数据库。<br />4.开发一个搜索页面,从数据库里查询关键字<br />  对查询关键字,进行一些逻辑处理。然后返回名称和url到页面

2010-06-01 23:12:00 611

转载 解决nutch的segmens的拆分与nutch crawl的重载(重新构建)问题

<br /><br />主题:解决nutch的segmens的拆分与nutch crawl的重载(重新构建)问题<br /><br />主要内容<br />一、Lucene的索引机制与索引文件结构<br />二、Nutch的爬虫分析与文件结构分析<br />三、Nutch segments的拆分索引实现方案<br /><br />一、Lucene的索引机制与索引文件结构<br />1、Lucene的索引机制<br />2、Lucene文件格式<br />_0.f0,_0.f1 文档文件<br /

2010-06-01 23:10:00 673

Excel表格的35招必学秘技

Excel表格的35招必学秘技 Excel表格的35招必学秘技

2010-07-07

js表單驗證大全 正則。。。

一個隨身的技巧手冊,txt版本的,所以,廣大友人可以在公車上,電梯間,抑或者睡前三分鐘,鞏固和複習, 減少浪費生命的行為 不错的JS验证~~~~~~~~~~~~~~~~~~~~~~~~~ 用途:校验ip地址的格式 输入:strIP:ip地址 返回:如果通过验证返回true,否则返回false; */ function isIP(strIP) { if (isNull(strIP)) return fals。。。。。。

2010-04-14

JavaScript-js宝典笔学习记.txt

還是哪句話,txt,減少浪費生命的行為 每一项都是js中的小技巧,但十分的实用! 1.document.write(""); 输出语句 2.JS中的注释为// 3.传统的HTML文档顺序是:document->html->(head,body) 4.一个浏览器窗口中的DOM顺序是:window->(navigator,screen,history,location,document) 5.得到表单中元素的名称和值:document.getElementById("表单中元素的ID号").name(或value) 6.一个小写转大写的JS: document.getElementById("output").value = document.getElementById("input").value.toUpperCase(); 7.JS中的值类型:String,Number,Boolean,Null,Object,Function 8.JS中的字符型转换成数值型:parseInt(),parseFloat() 9.JS中的数字转换成字符型:(""+变量) 10.JS中的取字符串长度是:(length) 11.JS中的字符与字符相连接使用+号. 12.JS中的比较操作符有:==等于,!=不等于,>,>=,<.<= 13.JS中声明变量使用:var来进行声明 14.JS中的判断语句结构:if(condition){}else{} 15.JS中的循环结构:for([initial expression];[condition];[upadte expression]) {inside loop} 16.循环中止的命令是:break 17.JS中的函数定义:function functionName([parameter],...){statement[s]} 18.当文件中出现多个form表单时.可以用document.forms[0],document.forms[1]来代替. 19.窗口:打开窗口window.open(), 关闭一个窗口:window.close(), 窗口本身:self 20.状态栏的设置:window.status="字符"; 21.弹出提示信息:window.alert("字符");

2010-04-14

JQuery1.3笔记.txt

一個隨身的技巧手冊,txt版本的,所以,廣大友人可以在公車上,電梯間,抑或者睡前三分鐘,鞏固和複習, 減少浪費生命的行為 Attribute: $(“p”).addClass(css中定义的样式类型); 给某个元素添加样式 $(“img”).attr({src:”test.jpg”,alt:”test Image”}); 给某个元素添加属性/值,参数是map $(“img”).attr(“src”,”test.jpg”); 给某个元素添加属性/值 $("img").attr("title", function() { return this.src }); 给某个元素添加属性/值 $("元素名称").html(); 获得该元素内的内容(元素,文本等) $("元素名称").html("<b>new stuff</b>"); 给某元素设置内容 $("元素名称").removeAttr("属性名称") 给某元素删除指定的属性以及该属性的值 $("元素名称").removeClass("class") 给某元素删除指定的样式 $("元素名称").text(); 获得该元素的文本 $("元素名称").text(value); 设置该元素的文本值为value $(“元素名称”).toggleClass(class) 当元素存在参数中的样式的时候取消,如果不存在就设置此样式 $("input元素名称").val(); 获取input元素的值 $("input元素名称").val(value); 设置input元素的值为value Manipulation: $("元素名称").after(content); 在匹配元素后面添加内容 $("元素名称").append(content); 将content作为元素的内容插入到该元素的后面 $("元素名称").appendTo(content); 在content后接元素 $("元素名称").before(content); 与after方法相反 $("元素名称").clone(布尔表达式) 当布尔表达式为真时,克隆元素(无参时,当作true处理) $("元素名称").empty() 将该元素的内容设置为空 $("元素名称").insertAfter(content); 将该元素插入到content之后 $("元素名称").insertBefore(content); 将该元素插入到content之前 $("元素").prepend(content); 将content作为该元素的一部分,放到该元素的最前面 $("元素").prependTo(content); 将该元素作为content的一部分,放content的最前面 $("元素").remove(); 删除所有的指定元素 $("元素").remove("exp"); 删除所有含有exp的元素

2010-04-14

java2实用教程电子书

AVA编程相关 第一章 第一章 1....JAVA 语言入门 ............................1 言入门 的诞生 JAVA 的诞生....

2010-04-13

jQuery基础教程 中文般,但不是第二版

讓我一通好找,中文版的,呵呵.好好學習,天天向上

2010-04-13

我是如何成为史上最牛淘宝客的

淘寶 電子商務 排名 生意 網絡營銷淘寶 電子商務 排名 生意 網絡營銷淘寶 電子商務 排名 生意 網絡營銷淘寶 電子商務 排名 生意 網絡營銷

2010-04-13

jQuery技巧大放送

1、关于页面元素的引用 通过jquery的$()引用元素包括通过id、class、元素名以及元素的层级关系及dom或者xpath条件等方法,且返回的对象为jquery对象(集合对象),不能直接调用dom定义的方法。 2、jQuery对象与dom对象的转换 只有jquery对象才能使用jquery定义的方法。注意dom对象和jquery对象是有区别的,调用方法时要注意操作的是dom对象还是jquery对象。 普通的dom对象一般可以通过$()转换成jquery对象。 如:$(document.getElementById("msg"))则为jquery对象,可以使用jquery的方法。 由于jquery对象本身是一个集合。所以如果jquery对象要转换为dom对象则必须取出其中的某一项,一般可通过索引取出。 如:$("#msg")[0],$("div").eq(1)[0],$("div").get()[1],$("td")[5]这些都是dom对象,可以使用dom中的方法,但不能再使用Jquery的方法。 以下几种写法都是正确的: $("#msg").html(); $("#msg")[0].innerHTML; $("#msg").eq(0)[0].innerHTML; $("#msg").get(0).innerHTML; 。。。。

2010-04-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除