paoding自定义词典研究1

这几天研究paoding分词器的使用,遇到一个很棘手的问题 在使用庖丁自定义词典的时候,按照网上查的资料, 1.首先自定义一个XXX.dic的文件,以utf-8保存; 2.将自定义词添加到dic\locale下的XXX.dic中; 3.删除.compile文件夹 用如下代码测试分词效果:...

2012-10-13 16:35:35

阅读数 2460

评论数 0

paoding(庖丁)分词器配置安装

1.首先从网上下载庖丁分词器的包:http://code.google.com/p/paoding/downloads/list 2.解压到本地磁盘,例如我的存放路径:C:\lucene\paoding 3.创建环境变量PAODING_DIC_HOME,值为:C:\lucene\paoding...

2012-10-13 16:22:00

阅读数 2513

评论数 0

lucene学习笔记2--检索

对已经创建好的索引库进行检索 /** * 利用关键词对索引进行查询 * * @param keyword  搜索条件 * @param indexPath 索引路径 * @throws IOException  * @throws ParseException  * @see [...

2012-10-13 16:13:39

阅读数 496

评论数 0

lucene学习笔记1--索引创建

创建索引代码: public void createIndex(String indexPath, String dataDir) throws IOException { //获取数据源文件列表 File[] files = new File(dataDir).listFiles...

2012-10-13 16:11:27

阅读数 428

评论数 0

机器学习之K-means聚类算法

k均值算法的计算过程非常直观:       1、从D中随机取k个元素,作为k个簇的各自的中心。       2、分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇。       3、根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有元素各自维度的...

2017-09-14 19:36:15

阅读数 264

评论数 0

机器学习-分类算法之朴素贝叶斯

条件概率公式:P(A|B) = P(AB)/P(B) 贝叶斯定理:P(A|B) = P(B|A)P(A)/P(B) 朴素贝叶斯算法思想:给定一个待分类的数据 X={a1,a2,……,aN},即N个特征项,目标分类集合Y={y1,y2,……,yK},即有K个分类 通过计算P(yi|X),分别计...

2017-09-13 18:44:23

阅读数 231

评论数 0

common-pool1.6连接池源码分析流程图

2017-05-24 09:07:00

阅读数 427

评论数 0

javaJDK并发包类图

类图

2017-04-09 18:07:41

阅读数 1302

评论数 0

java容器UML图

UML 图

2017-04-09 16:24:21

阅读数 587

评论数 0

如何实现高效的并发编程

1.无锁并发编程    锁竞争会引起上下文切换,所以避免使用锁是一种办法:例如将数据进行hash,进行分段,不同线程处理不同的段上的数据。 2.CAS算法    java的Atomic包使用CAS算法来更新数据,而不需要加锁 3.使用最少线程    避免创建不需要的线程,例如任务很少,却创...

2016-06-05 09:25:52

阅读数 1001

评论数 0

【搜索系列】检索模型

1.向量空间模型 2.布尔模型 3.概率检索模型

2016-01-30 13:16:12

阅读数 468

评论数 0

Elasticsearch权威指南(中文版)

http://es.xiaoleilu.com/010_Intro/10_Installing_ES.html

2015-08-30 13:59:01

阅读数 2062

评论数 0

solr源码下载地址

http://archive.apache.org/dist/lucene/solr

2015-06-15 10:04:46

阅读数 2036

评论数 0

zookeeper 安装

转载 http://www.cnblogs.com/sunddenly/p/4018459.html

2015-05-31 21:31:07

阅读数 406

评论数 0

solrCloud部署

转载 http://blog.javachen.com/2014/03/10/how-to-install-solrcloud.html

2015-05-31 11:02:11

阅读数 412

评论数 0

rabbitmq开发入门指南

官网的开发指南 http://www.rabbitmq.com/getstarted.html 按照教程中得6个范例学习,基本能理解消息中间件的原理与应用场景

2015-04-12 09:47:16

阅读数 713

评论数 0

rabbitmq环境搭建--安装

操作系统 mac OS X 10.10 安装步骤 1.下载 erlang包 从Erlang的官网 http://www.erlang.org/download.html 下载最新的erlang安装包,Linux和MacOSX下载的版本是 R15B01 Source File(72.0 MB)  ...

2015-04-11 20:08:58

阅读数 3527

评论数 0

使用nohup让程序在远程主机后台运行

http://www.williamlong.info/archives/482.html

2015-03-27 13:38:12

阅读数 569

评论数 0

supervise系统进程监控

http://lehsyh.iteye.com/blog/745683

2015-03-27 13:28:28

阅读数 809

评论数 0

linux下使用supervisor监控应用程序

http://blog.csdn.net/heyjackie/article/details/12995187

2015-03-27 11:32:42

阅读数 761

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭