- 博客(37)
- 资源 (9)
- 收藏
- 关注
原创 Lucene中文切分原理及其他常见切分算法
1、 什么是中文分词学过英文的都知道,英文是以单词为单位的,单词与单词之间以空格或者逗号句号隔开。而中文则以字为单位,字又组成词,字和词再组成句子。所以对于英文,我们可以简单以空格判断某个字符串是否为一个单词,比如I love China,love 和 China很容易被程序区分开来;但中文“我爱中国”就不 一样了,电脑不知道“中国”是一个词语还是“爱中”是一个词语。把中文的句子切分成有意义的词,就
2016-08-05 18:06:02 6616
转载 Lucene 算法原理
Lucene的概述: Lucene(发音为 [‘lusen] )是一个非常优秀的开源的全文搜索引擎,我们可以在它的上面开发出各种全文搜索的应用来。Lucene在国外有很高的知名度,现在已经是Apache的顶级项目,在国内,Lucene的应用也越来越多。Lucene的算法原理: Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇
2016-08-05 17:19:04 4241
原创 Lucene 6.1.0 入门Demo
根据Lucene 6.1.0 及JDK 1.8最新版本,结合前几篇文章所写的最新Demo. 代码如下:package Demo;import java.io.File;import java.io.FileReader;import java.nio.file.FileSystems;import org.apache.lucene.analysis.Analyzer;import org
2016-08-05 10:16:15 11693 7
原创 Lucene教程(三) 索引域选项
通过上两篇的学习,想必已经入了门了,今天来看索引域选项中的几个值得设置 先来看一个构造器: /** * Create a field by specifying its name, value and how it will * be saved in the index. Term vectors will not be stored in the index. *
2016-08-04 17:50:17 1168
原创 Lucene在Eclipse上的部署And Example
Tools required: Apache lucene – Download Here (After downloading extract the files to the desktop) JDK/JRE 7 – Download Here (Install) Eclipse – Download HereApache Lucene: Lucene is a full text se
2016-08-04 17:22:31 1616 1
原创 Lucene教程(二) 搜索
搜索可分为如下几步: 创建Directory 创建IndexReader 根据IndexReader创建IndexSearch 创建搜索的Query 根据searcher搜索并且返回TopDocs 根据TopDocs获取ScoreDoc对象 根据searcher和ScoreDoc对象获取具体的Document对象 根据Document对象获取需要的值 下面是例子代码: 3.5版
2016-08-04 17:11:34 648
原创 Lucene教程(一) 创建索引
简述: 由于Lucene不同的版本差距较大,,此系列教程打算把3.5版本,4.5版本,5.0版本都给出个例子,方便大家学习,也方便自己复习。注:由于Lucene5.0版本是基于JDK1.7开发的,所以想学习的同学请配置1.7及以上的版本。故测试Lucene 6.1.0也适用Lucene 5.0中的代码。Lucene 6.1.0最低要求也是JDK1.7.创建索引可分为主要的几步,我自己试验过,不同的
2016-08-04 16:59:22 972
原创 字符串空格分割
#include #include #include using namespace std;void trans1(){ //如果字符串最后面没有空格,字符后面紧接着是换行符,可用: int n; char s[50][50]; char c; for(n = 0; scanf("%s%c", s[n], &c); n++) {
2014-04-30 16:01:19 846
转载 预先队列
优先队列:顾名思义,首先它是一个队列,但是它强调了“优先”二字,所以,已经不能算是一般意义上的队列了,它的“优先”意指取队首元素时,有一定的选择性,即根据元素的属性选择某一项值最优的出队~百度百科上这样描述的: 优先级队列 是不同于先进先出队列的另一种队列。每次从队列中取出的是具有最高优先权的元素 优先队列的类定义 优先队列是0个或多个元素的集合,每个元素都有一个优先权或
2014-04-23 19:01:00 375
转载 stl 之应用
STL简介 1 概况.......................................................... 21.1 STL是什么............................................... 21.2 为什么我们需要学习STL................................... 21.3 初识ST
2014-04-16 13:55:20 429
原创 判断整数类型是否由不同整数构成
#include#include #include using namespace std;bool check(int a){ int flag[10]; memset(flag,0,sizeof(flag)); while(a) { flag[a%10]++; a /= 10; } for(int i= 1; i<10; i++) { if(flag[
2014-03-14 13:15:45 574
转载 背包九讲
背包九讲--各种背包问题P01: 01背包问题 题目 有N件物品和一个容量为V的背包。第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。 基本思路 这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。 用子问题定义状态:即f[i][v]表示前i件物品恰放入一个容量为v的背包可
2013-09-12 20:04:14 450
原创 烟台大学acm暑期集训总结
烟台大学acm暑期集训总结从7月15号暑假开始,我们烟大的acm暑期集训也就算是正式开始了。我们学校的学习环境还是相当不错的,我们在里面可以安静的做题,以前我们集训都是一边上课一边做题,现在终于可以一整天的在实验室里做题。不过我感觉我一个暑假的训练还是比较失败的,可能因为从青岛回来感觉比赛已经差不多结束了,所以压力小了很多。做完一道题就休息一会,整体的环境也是很轻松的。一开始做题也还行,后来因
2013-08-25 13:12:50 1692 2
转载 全排列
public static void main(String[] args) { // TODO Auto-generated method stub List list = quanpai("12345"); for (String string : list) { Syste
2013-07-24 17:59:00 382
原创 c++ list 用法
双向循环链表list list是双向循环链表,,每一个元素都知道前面一个元素和后面一个元素。在STL中,list和vector一样,是两个常被使用的容器。和vector不一样的是,list不支持对元素的任意存取。list中提供的成员函数与vector类似,不过list提供对表首元素的操作push_front、pop_front,这是vector不具备的。和vector另一点不
2013-07-21 11:59:00 668
原创 Broken Necklace
Broken NecklaceYou have a necklace of N red, white, or blue beads (3 1 2 1 2 r b b r b r r b r
2013-07-20 11:18:02 410
原创 Friday the Thirteenth
Friday the ThirteenthIs Friday the 13th really an unusual event?That is, does the 13th of the month land on a Friday less often thanon any other day of the week? To answer this question, write a
2013-07-20 09:38:49 434
原创 Greedy Gift Givers
Greedy Gift GiversA group of NP (2 ≤ NP ≤ 10) uniquely named friends hasdecided to exchange gifts of money. Each of these friends might ormight not give some money to any or all of the other frien
2013-07-20 09:37:09 472
原创 Your Ride Is Here
Your Ride Is HereIt is a well-known fact that behind every good comet is a UFO. TheseUFOs often come to collect loyal supporters from here on Earth.Unfortunately, they only have room to pick up on
2013-07-20 09:33:19 440
原创 1242 Rescue
http://acm.hdu.edu.cn/showproblem.php?pid=1242采用bfs算法,并且需要注意:朋友是有很多的,搜索时要a去寻找r.#include #include#includeusing namespace std;char map[202][202];int visit[202][202];int c,r,i,j,minn=10000,ai,a
2013-06-04 14:11:22 372
转载 判断欧拉回路是否存在的方法
原文地址:判断欧拉回路是否存在的方法作者:万剑山河判断一个图中是否存在欧拉回路(每条边恰好只走一次,并能回到出发点的路径),在以下三种情况中有三种不同的算法:一、无向图每个顶点的度数都是偶数,则存在欧拉回路。二、有向图(所有边都是单向的)每个节顶点的入度都等于出度,则存在欧拉回路。以上两种情况都很好理解。其原理就是每个顶点都要能进去多少次就能出来多少次。三、混合图(有的
2013-05-31 16:49:59 735
原创 1159 Common Subsequence
Common SubsequenceTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 16552 Accepted Submission(s): 6922Problem DescriptionA subseque
2013-05-29 11:38:21 304
原创 Super Jumping! Jumping! Jumping! 1087
Nowadays, a kind of chess game called “Super Jumping! Jumping! Jumping!” is very popular in HDU. Maybe you are a good boy, and know little about this game, so I introduce it to you now.The g
2013-05-29 11:26:13 351
原创 Nightmare 1072
NightmareTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 5211 Accepted Submission(s): 2598Problem DescriptionIgnatius had a nightmare
2013-05-29 11:17:14 423
原创 Rightmost Digit 1061
Rightmost DigitTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 24421 Accepted Submission(s): 9324思路: 这题结果是一个循环。而且每个结果只保留最后一位即可。
2013-05-29 10:37:36 339
原创 Fibonacci Again 1021
Fibonacci AgainTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 28237 Accepted Submission(s): 13636需要注意这些数的规律。。Problem Descripti
2013-05-29 10:32:36 422
原创 Least Common Multiple 1019
#include using namespace std;int main(){ int Mul(int ,int); int c; int num; cin>>c; //zong; for(int i = 0; i<c; i++) //zong { int a,b,mul;
2013-05-29 10:29:38 342
原创 Elevator 杭电1008
ElevatorTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 32871 Accepted Submission(s): 17856Problem DescriptionThe highest buildin
2013-05-29 10:26:43 422
原创 利用java 快速实现加减乘数余运算
import java.util.Scanner;import java.math.*;public class Main { public static void main(String[] args) { Scanner sc=new Scanner(System.in); String s1 = sc.next(); String s2 = sc.next(); BigInte
2013-05-28 17:57:23 969
原创 Drainage Ditches (最大流问题)
http://acm.hdu.edu.cn/showproblem.php?pid=1532#include #include #include #include #define INF 100000#define Min(x,y) x<y?x:yusing namespace std;int map[205][205];int flow[205][205];int tem[2
2013-05-28 17:03:55 517
原创 多个大数相加问题
#include #includeusing namespace std;#define MAXSIZE 104void Add(char *str1, char *str2, char *str3){ int i,j,i1,i2,tmp,carry; int len1 = strlen(str1), len2 = strlen(str2); char ch;
2013-05-28 16:58:18 484
原创 最长有序子序列及其路径
#include #include #define N 8 using namespace std; int a[N] = {5, 1, 2, 6, 5, 6,2,1 }; //int a[10] = {6,5,4,2,9,1,5,12,3,2};int f[N];int l[N];//表示路径。int e = 0; int main() //找最长递减子序列。 {
2013-05-28 16:57:27 512
原创 最少拦截系统
题目:http://acm.hdu.edu.cn/showproblem.php?pid=1257思路: 采用贪心的做法,每次都选择最接近导弹的高度。#include #includeusing namespace std;int check(int len_min[], int sum, int n) //现有导弹系统,及要打到打距离/{ int locat=0;
2013-05-28 16:55:46 426
原创 FatMouse's Speed
题目要求:http://acm.hdu.edu.cn/showproblem.php?pid=1160思路: 运用结构体,对两个分别排序#include #includeusing namespace std;//int a[10] = {6,5,4,2,9,1,5,12,3,2};int f[1002];int l[1002];//表示路径。int e
2013-05-28 16:52:08 336
原创 sort与qsort用法整理
#include#define N 5一. intmain() //简单排序。{ int a[5]; //换成char a[5]可对字符从小到大排序。 for(int i = 0; i cin>>a[i]; sort(a,a+5); //默认从小到大排序就不用写cmp. for(int i
2013-05-28 16:47:24 432
原创 acm常用函数集锦--动态修改中
#include//设定插入点 #include //字符处理#include//定义错误码 #include //浮点数处理#include//文件输入/输出#include //参数化输入/输出#include//数据流输入/输出#include //定义各种数据类型最值常量#include //定义本地化函数#include //定义数学函数
2013-05-28 16:45:38 635
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人