- 博客(14)
- 资源 (8)
- 收藏
- 关注
转载 在Solr中配置和使用ansj分词
原文:http://www.cnblogs.com/likehua/p/4481219.html在上一节【编译Ansj之Solr插件】中介绍如何编译ansj分词在solr(lucene)环境中使用的接口,本章将介绍如何在solr中使用ansj,其步骤主要包括:下载或者编译ansj和nlp-lang等jar包、在schema中配置相关类型、将ansj和nlp-lang等jar包配置到solr中、
2016-11-28 15:36:47 1952
转载 编译Ansj之Solr插件
Ansj是一个比较优秀的中文分词组件,具体情况就不在本文介绍了。ansj作者在其官方代码中,提供了对lucene接口的支持。如果用在Solr下,还需要简单的扩展一下。1、基于maven管理 ansj是基于maven进行开发管理的。我们首先修改一下其pom.xml,具体如下所示:<project xmlns="http://maven.apache.org/POM/4.0.0"
2016-11-28 15:23:21 602
转载 mongod统计(类似sql group by)aggregate函数使用方法
使用方法:db.collection.aggregate([array]);array可是是任何一个或多个操作符。操作符介绍:$project:包含、排除、重命名和显示字段$match:查询,需要同find()一样的参数$limit:限制结果数量$skip:忽略结果的数量$sort:按照给定的字段排序结果$group:按照给定表达式组合结果$
2016-11-22 15:46:56 576
原创 mongodb索引增删查
mongodb默认的唯一索引是_id(不可删),在特殊需求下可以建立更多的索引,满足查询需要,建议还是不要在mongo下做其他字段的查询,数据量大的话会严重影响性能1.管理员模式进入mongo/service/bin (win键-输入CMD-ctrl+shift+enter)f:cd F:\DEVELOPER\innovateServices\mongodb\servic
2016-11-22 15:16:03 405
转载 MongoDB的真正性能
原文:http://www.cnblogs.com/crazylights/archive/2013/05/08/3066056.html最近开始研究MySQL和MongoDB,发现这方面资料不多。尤其是真正的说到点子上的文章,太少了。有一些对比测试的文章基本上都是瞎测,测试方法都测到了马腿上,得出的结论基本上都是NoSQL毫无价值容我借用Russell Smi
2016-11-21 15:55:48 533
原创 Map根据value排序ASC DESC
需求有点刁钻,写关键词组合匹配标题的时候,遇到关键词像这样XXX XXX 1222XXX XXX 222XXX XXX 22XXX XXX 22XXX XXX 11XXX XXX 1XXX XXX 1前面的XXX 代表关键词,两两组合,后面的数字代表优先级,优先级高的优先匹配那么问题来了,每匹配到一个词组,要提取出来,作为新的匹配词组表,这个步骤就肯定了顺序是乱
2016-11-21 14:31:25 916
原创 tomcat搭建图片服务器
Tomcat搭建简单的图片访问服务器1.安装tomcat后,修改进入%CATALINA_HOME%/conf/Catalina/localhost文件夹2.新建一个*.xml文件,作为要设置服务器本地文件路径的xml,比如我设置成resource.xmlresource.xml内容如下:3.名词解释:path:resource是要访问的url根路径 ,比如lo
2016-11-15 13:45:57 6409 4
转载 Apache搭建简单的图片访问服务器
由于网站图片较多,为了维护方便,将图片放在了工程外,这又涉及到了图片访问的问题,于是想到用apache做个服务,来访问图片, 不知道是不是这样符不符合要求,但是解决了我的问题,欢迎了解的oscer指点
2016-11-15 13:42:05 8279
原创 物理主机连接虚拟机数据库
0.设置虚拟机桥接物理机ip1.关闭虚拟机放火前2.防火墙--->高级设置-->入站规则-->添加规则-->添加端口-->输入数据库端口-->确定-->保存3.物理机通过虚拟机IP和端口访问数据库
2016-11-10 16:51:27 949
转载 十个 MongoDB 使用要点
十个 MongoDB 使用要点从 mongodb 阶段性技术总结 中抽取并整理了对大家有帮助的十个要点: 1.mongodb 表名和字段名统一用小写字母mongodb 是默认区分大小写的,为了避免以前在 mysql 下遇到的大小写敏感导致程序访问频频出错,建立规范,mongodb 的表名和字段名都用小写字母命名。 2.尽可能的缩短字段名的
2016-11-10 14:07:10 377
转载 中科院NLPIR中文分词java版
摘要:为解决中文搜索的问题,最开始使用PHP版开源的SCWS,但是处理人名和地名时,会出现截断人名地名出现错误。开始使用NLPIR分词,在分词准确性上效果要比SCWS好。本文介绍如何在windows系统下编译JAVA ,生成可以执行的jar文件。NLPIR的下载地址:http://ictclas.nlpir.org/downloadsGitHub的地址:
2016-11-06 06:20:58 1772
转载 spring 使用@scheduled注解执行定时任务
spring 第13天 使用@scheduled注解执行定时任务使用spring的注解 @Scheduled 执行定时任务 创建spring-task.xml 文件 <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.
2016-11-03 15:47:19 3690 1
原创 lucene5.3.1 maven + 增删改查 详细注释
注:本示例是基于lucene5.3.1版本,其他版本要做相应修改step 1.invoke lucene in maven org.apache.lucene lucene-core 5.3.1 org.apache.lucene lucene-analyzers-common 5.3.1 org.apache.lucene luc
2016-11-01 11:03:50 3900
转载 lucene5.3.1简单增删改查、评分、分页
lucene5.3.1简单增删改查、评分、分页package com.innovate.test.lucene.demo;import java.io.IOException;import java.nio.file.Paths;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analy
2016-11-01 10:37:20 847
pdksh-5.2.14-37.el5.x86_64.rpm
2017-09-17
Docker部署red5流媒体视频播放接口教程源码打包
2017-04-17
CSDN知识图谱插件分享,拓扑图插件分享
2017-03-31
java RSA加解密 zip加解密, js MD5 SHA1 RSA加密
2017-01-13
springboot全系教程源码
2016-10-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人