自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (77)
  • 收藏
  • 关注

原创 lucene中不同的字段应用不同的分词

 在lucene的现有的Analyzer的TokenStream tokenStream(String fieldName, Reader reader)方法中的第一个参数String fieldName都没有得用应用.在现有的lucene(<=lucene2.4)建索引过程中,所有的字段都用一种分词,这个参数是没用的.今天突然有这个想法,可以写一个Analyzer,在TokenStream to

2008-09-18 10:46:00 604

原创 Lucene搜索中ParserException异常处理

 ParserException异常是查询分析器QueryParser的parser函数处理一些lucene中的特殊字符时出现的,这些符号有:+-&|!(){}[]^~*?: /} 还有 AND OR NOT,我的处理方法是把+-&|!(){}[]^~*?: /}过滤掉,把搜索词都转化为小写。

2007-11-15 14:19:00 680

原创 如何把Vector ArrayList等类型转化为数组

 Vector ArrayList等类型转化为数组类型时用(例如转化为String 数组):Vector vector = new Vector() ;vector.add("123") ;vector.add("456") ;String []array =  vector.toArray(new String[0]);以前一直不知道怎么直接用toArray转化,这是最近看lucene的High

2007-10-09 16:30:00 1061

原创 类CompoundReader

lucece中CompoundFileReader extends Diretory,从而统一了用.cfs和不用.cfs的读取索引中不同部分文件方法。 

2007-09-28 16:01:00 475

原创 Lucene中IndexSearcher类的初始化

   Lucene中IndexSearcher的构造函数有以下几个:/** *//** Creates a searcher searching the index in the named directory. */public IndexSearcher(String path) throws IOException ...{    this(IndexReader.open(

2007-03-20 19:05:00 2629 3

信息技术快报2006年 第4卷 第5期 (总第36期)

信息技术快报2006年 第4卷 第5期 (总第36期)

2008-12-26

信息提取技术概述 孙斌(北京大学计算机系)

本文试图对信息提取作一比较全面的概述,以期使读者对它有一个较为综合的了解。内容包括信息提取的含义、技术目标、实际背景和现状,以及其中设计到的主要技术环节、工程内容和难点等。并由此明确信息提取作为一门语言应用工程技术的定位和实际工作策略。

2008-12-26

信息安全概论-段云所-北京大学信息学院.ppt

信息安全概论-段云所-北京大学信息学院.ppt

2008-12-26

信息技术快报2006年 第4卷 第2期 (总第33期).pdf

信息技术快报2006年 第4卷 第2期 (总第33期).pdf

2008-12-26

信息技术快报2005年 第3卷 第2期 (总第21期).doc

信息技术快报2005年 第3卷 第2期 (总第21期).doc

2008-12-26

信息技术快报--2003年 第6期

信息技术快报--Information Technology Letter 中国科学院计算技术研究所 2003年 第6期

2008-12-26

采用蚁群爬山法进行聚类分析的算法

介绍了一种基于密度和网格的聚类分析算法——蚁群爬山法(ACH),这种算法能自动获得簇数k的值和任意形状的簇的划分,并具有较好的并行性。通过对网格大小的控制可获得不同层次的聚类结果。

2008-12-26

基于EM算法的汉语自动分词方法

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM算法,对实验结果进行了分析。最后对算法进行了总结与讨论。

2008-12-26

智能门户搜索引擎技术

智能门户搜索引擎技术 pdf格式 《计算机工程》

2008-12-26

Word Segmentation:The Role of Distributional Cues.pdf

Word Segmentation:The Role of Distributional Cues.pdf

2008-12-25

-中文信息处理“奇葩绽放”.pdf

-中文信息处理“奇葩绽放”.pdf 哈工大 刘挺

2008-12-25

数据仓库和数据挖掘百科全书第二版四卷 AUG 2008 pdf

数据仓库和数据挖掘百科全书第二版四卷Encyclopedia of Data Warehousing and Mining Second Edition (4 Volumes) AUG 2008

2008-12-24

how to think like a computer scientist pdf

how to think like a computer scientist pdf格式

2008-12-22

javacc构造编译器的方法

javacc构造编译器的方法 javacc代码生成器的基本介绍.

2008-12-11

Data.Structures.Algorithms.and Applications.in C++.CHS.codes

Data.Structures.Algorithms.and Applications.in C++.CHS.codes

2008-12-11

Data.Structures.Algorithms.and Applications.in C++

Data.Structures.Algorithms.and Applications.in C++

2008-12-11

Introduction to Information Retrieval

Introduction to Information Retrieval Cambridge University Press 2008

2008-12-11

C How to program 4E.part5.rar

C How to program 4E(不是C++) 部分章节以及完整的PPT和example 共5部分. 这是第5部分.

2008-07-21

C How to program 4E.part4.rar

C How to program 4E(不是C++) 部分章节以及完整的PPT和example 共5部分. 这是第4部分.

2008-07-21

C How to program 4E.part3.rar

C How to program 4E(不是C++) 部分章节以及完整的PPT和example 共5部分. 这是第3部分.

2008-07-21

C How to program 4E.part2.rar

C How to program 4E(不是C++) 部分章节以及完整的PPT和example 共5部分. 这是第2部分.

2008-07-21

C How to program 4E.part1.rar

C How to program 4E(不是C++) 部分章节以及完整的PPT和example 共5部分. 这是第1部分.

2008-07-21

vc++ 编程指南

vc++ 编程指南......

2007-06-26

visual c++_mfc专题讲座

visual c++_mfc专题讲座

2007-06-26

dfsadsafdstewqerwqt

dsafdsagdsafdsa

2016-12-14

spring in action,4th edition

spring in action,4th edition

2015-01-16

Hadoop in Practice(2012)

2012 | ISBN-10: 1617290238 | PDF, EPUB | 536 pages | 26 + 37 MB Hadoop in Practice collects 85 Hadoop examples and presents them in a problem/solution format. Each technique addresses a specific task you'll face, like querying big data using Pig or writing a log file loader. You'll explore each problem step by step, learning both how to build and deploy that specific solution along with the thinking that went into its design. As you work through the tasks, you'll find yourself growing more comfortable with Hadoop and at home in the world of big data. About the Technology Hadoop is an open source MapReduce platform designed to query and analyze data distributed across large clusters. Especially effective for big data systems, Hadoop powers mission-critical software at Apple, eBay, LinkedIn, Yahoo, and Facebook. It offers developers handy ways to store, manage, and analyze data. About the Book Hadoop in Practice collects 85 battle-tested examples and presents them in a problem/solution format. It balances conceptual foundations with practical recipes for key problem areas like data ingress and egress, serialization, and LZO compression. You'll explore each technique step by step, learning how to build a specific solution along with the thinking that went into it. As a bonus, the book's examples create a well-structured and understandable codebase you can tweak to meet your own needs.

2012-12-12

剑桥专业英语:【Infotech English for computer users Fourth Edition】影印本

剑桥专业英语:【Infotech English for computer users Fourth Edition】影印本

2009-01-07

C程序设计语言_第2版新版.pdf

前四章用的是china-pub上的样张,后面的是别人OCR的。这个是徐宝文翻译出版的版本,文件名或者说中文书名的所谓第二版新版是指在原文第二版的基础上新翻译的

2009-01-07

Visual Basic.NET实用数据库编程.part2.rar

Visual Basic.NET实用数据库编程.part2.rar(共2部分)2009.1

2009-01-06

Visual Basic.NET实用数据库编程.part1.rar

Visual Basic.NET实用数据库编程.part1.rar(共2部分) 2009.1

2009-01-06

实用算法的分析与程序设计

实用算法的分析与程序设计 很不错的算法知识,涵盖了大部分常用的算法。

2008-12-29

网页变化与增量搜集技术

网页变化与增量搜集技术 信息检索 搜索引擎

2008-12-26

基于K_means聚类算法的分析及应用

基于K_means聚类算法的分析及应用.pdf

2008-12-26

Lucene检索算法的改进.pdf

Lucene检索算法的改进.pdfLucene检索算法的改进.pdf

2008-12-25

lukeall-0.9.1.jar

lucene索引查看器 Current version is 0.9.1, released on 22 Nov 2008. It uses the official Lucene 2.4.0 release JARs.

2008-12-25

luke-src-0.9.1.zip

lucene索引查看器 Current version is 0.9.1, released on 22 Nov 2008. It uses the official Lucene 2.4.0 release JARs.

2008-12-25

中文版SQL SERVER 2000开发与管理应用实例.part3.rar

中文版SQL SERVER 2000开发与管理应用实例.part3.rar(共3部分)

2008-12-25

中文版SQL SERVER 2000开发与管理应用实例.part2.rar

中文版SQL SERVER 2000开发与管理应用实例.part2.rar(共3部分)

2008-12-25

中文版SQL SERVER 2000开发与管理应用实例.part1.rar

中文版SQL SERVER 2000开发与管理应用实例.part1.rar(共3部分)

2008-12-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除