自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨鑫newlife的专栏

算法就是我的灵魂

  • 博客(65)
  • 资源 (192)
  • 收藏
  • 关注

原创 RegexQuery正则搜索

RegexQuery正则搜索

2015-03-31 19:51:35 1041

原创 WildCardQuery通配符查找

通配符查找

2015-03-31 19:26:55 7729

原创 FuzzyQuery模糊查找

模糊查找

2015-03-31 19:12:08 11268 1

原创 MultiPharseQuery多短语搜搜索

多短语搜索

2015-03-31 16:46:21 1310

原创 短语搜索PhraseQuery

短语搜索

2015-03-30 20:52:55 2038

原创 PriexQuery前缀搜索

PriexQuery前缀搜索

2015-03-30 16:11:16 886

原创 RangQuery范围搜索

搜索引擎

2015-03-26 19:46:58 848

原创 BooleanQuery布尔搜索

/* * 这段代码写的是BooleanQuery布尔搜索 * 顾名思义就是布尔型查询。 * 布尔型,是由多个子句和子句间的布尔逻辑所组成的查询 * */package query;import java.io.IOException;import org.apache.lucene.analysis.standard.StandardAnalyzer;

2015-03-26 15:48:37 1556

原创 TermQuery词条搜索

/*这段代码写的是TermQuery, * 词条搜索方法,是Query搜索的一个根据提供指定的词条进行搜索的 * */package query;import java.io.IOException;import org.apache.lucene.index.Term;import org.apache.lucene.search.Hits

2015-03-26 15:48:05 1214

原创 The type java.lang.Object cannot be resolved

The type java.lang.Object cannot be resolved

2015-03-26 14:49:56 1430

原创 org.apache.commons.digester.Digester.parse(Ljava/net/URL;)Ljava/lang/Object;

java.lang.NoClassDefFoundError: org/apache/commons/chain/config/ConfigParser

2015-03-25 21:32:16 1764

原创 Exception in thread "main" java.io.IOException: Job failed!

Exception in thread "main" java.io.IOException: Job failed! 已解决

2015-03-24 14:45:41 4450

原创 Nucth学习笔记(一)

Nutch学习笔记(一)

2015-03-23 15:36:18 1317

原创 Robots协议

Robots协议

2015-03-23 14:53:47 1243

原创 修改secureCRT背景和字体的颜色

secureCRT修改背景颜色

2015-03-22 10:16:44 3269

原创 Lucene的IndexModifier方法

/* * 这段代码是为了体现Lucene2.0的新内容,IndexModifier类。 * 这个类和IndexWriter类基本功能是一样的,只是比IndexReader多了对索引的删除功能 * */package indexReader;import org.apache.lucene.analysis.standard.StandardAnalyzer;impo

2015-03-21 19:06:15 942

原创 使用Lucene的IndexReader读取索引文件的信息

/*前面学习了创建索引的方法是IndexWriter,这里所使用的是读取所创建的 * 索引的方法IndexReader. * 和他的子类 * MultiReader * */package indexReader;import java.io.IOException;import org.apache.lucene.analysis.standard.S

2015-03-21 10:53:50 4803

原创 使用RAMDirectory 和 FSDirectory对于索引创建的优化

/* * 这里使用的是索引的优化 * 这里有话使用的是对于FSDirectory和RAMDirectory的路径的选择, * FSDirectory使用的是系统磁盘上文件的路径 * 而RAMDiectory使用的是内存中的路径 * RAM的不可以永久保存 * 下面的代码就是分别演示这两种建立存储索引的方法。 * */package merge;impor

2015-03-21 10:24:03 1719

原创 符合索引格式 .cfs(参考上一篇博客)

这篇博客的内容和上一篇内容的区别不是很大,但是却是两个方向的,这里的连接是上一个博客的,http://blog.csdn.net/u012965373/article/details/44493541区别在于这篇的一条代码:writer.setUseCompoundFile(true);这条代码的意思是是否使用符合的索引。.csf文件的内容:

2015-03-20 17:02:12 1359

原创 利用Lucene测试索引生成的.fnm 和 .fdx 和 .fdt 和 .tii 和 .tis文件所包含的内容(详解)

搜索引擎

2015-03-20 16:12:11 2994

原创 利用Lucene的IndexWriter建立索引(详解)

搜索引擎

2015-03-20 16:09:05 2955

原创 Centos下执行cp命令式提示略过文件夹

CP略过文件夹

2015-03-19 15:09:44 1681

原创 500 - org.hibernate.TransactionException: JDBC rollback failed

Could not roll back Hibernate transaction; nested exception is org.hibernate.TransactionException: JDBC rollback failed

2015-03-19 11:22:44 4388

原创 使用Lucene对图书馆构建Document(文档)和Field(字段)

搜索引擎

2015-03-18 21:19:11 2017

原创 创建一个提供搜索功能的搜索类(可运行)

搜索引擎

2015-03-18 20:27:51 1038

原创 Lucene入门的基本知识(四)

搜索引擎

2015-03-18 16:01:50 919

原创 使用Lucene对预处理后的文档进行创建索引(可运行)

搜索引擎

2015-03-18 15:37:29 1419 1

原创 在Centos中导入sql文件的方法

在Centos中导入sql文件的方法

2015-03-17 20:14:39 5930

原创 如何使windows上的javaWEB项目发布到Centos上

如何使windows上的javaWEB项目发布到Centos上

2015-03-17 15:04:09 1875

原创 利用Lucene对大文件进行预处理(可运行)

搜索引擎

2015-03-15 21:33:35 1054

原创 利用Lucene将大文档切割成多个小文档,(可运行)

搜索引擎

2015-03-15 13:59:50 1142

原创 利用Lucene把文本的字体格式进行修改,然后输出到一个新的文件中

搜索引擎

2015-03-14 21:42:40 753

原创 通过Lucnene 对于文本的预处理,转换全角半角(可运行)

搜索引擎

2015-03-14 20:57:58 1125

原创 Centos6.2中配置tomcat

Centos6.2下安装并查看tomcat是否运行。

2015-03-14 16:31:59 4362

原创 利用servlet和html写一个简单的登录

利用servlet和html写一个简单的登录

2015-03-13 20:28:42 12763

原创 用Html写一个简单的登陆界面

用Html写一个简单的登陆界面

2015-03-13 19:45:57 20537 3

原创 在编写servlet时候import javax.servlet.annotation.WebServlet;问题

在编写servlet时候import javax.servlet.annotation.WebServlet;问题

2015-03-13 11:29:29 18629 8

原创 classid 是什么意思?

classid 是什么意思?

2015-03-12 21:35:32 5068

原创 SQL2008错误:当 MUST_CHANGE 为 ON (开)时,不能将 CHECK_POLICY 和 CHECK_EXPIRATION 选项设为 OFF (关)。

如果出现这种情况,第一个选择是:在数据库用户管理中去掉了“强制密码过期”!如果把“强制实施密码策略”的勾也去掉了,出现如下错误! 当 MUST_CHANGE 为 ON (开)时,不能将 CHECK_POLICY 和 CHECK_EXPIRATION 选项设为 OFF (关)。把用户:"删除重建" 如果不可以那么继续第二个:通过windows 身份

2015-03-12 17:50:42 5073

原创 C#实现队列的基本操作

using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication1{       class Queue    {                private int font = 0; 

2015-03-11 20:03:01 3116

斯坦福文本分类朴素贝叶斯实现课程讲义2021

斯坦福文本分类朴素贝叶斯算法实现课程讲义2021

2022-06-19

An Introduction to HTAP

An Introduction to HTAP

2022-04-26

datax.tar.gz

阿里开源ETL工具DataX

2021-08-22

ImpalaJDBC41.jar

ImpalaJDBC

2021-08-22

hive_jdbc_2.6.2.1002.zip

hive_jdbc_2.6.2.1002

2021-08-22

ClouderaHiveODBC.dmg

ClouderaHiveODBC

2021-08-22

开源SuperSet、MetaBD、Redash简单对比

开源SuperSet、MetaBD、Redash简单对比

2020-07-22

JVM内存管理知识思维导图.png

JVM内存管理知识思维导图.png

2020-05-22

深入浅出Otter与Canal.pdf

深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf

2020-02-29

weworkapi_python-master.zip

企业微信加密解密函数代码示例weworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zip

2020-01-20

实时指标计算引擎-Spark-Part_1_杨鑫_2019-12-19.pptx

实时指标计算引擎-Spark-Part_1_杨鑫

2019-12-19

Griffin数据质量管理技术调研.pdf

Griffin数据质量管理技术调研.pdf

2019-12-09

Kylin多维分析.pdf

Kylin多维分析.pdf

2019-12-05

CDH5.17版本Hue接入HBase步骤.pdf

CDH5.17版本Hue接入HBase步骤.pdfC

2019-11-28

Apache Kylin竞品分析.pdf

Apache Kylin竞品分析.pdf

2019-11-18

技术调研_数据质量管理&性能量化&多维分析 .pdf

技术调研_数据质量管理&性能量化&多维分析 ,技术调研_数据质量管理&性能量化&多维分析 ,技术调研_数据质量管理&性能量化&多维分析

2019-11-18

_bz2.cpython-36m-x86_64-linux-gnu.so

_bz2.cpython-36m-x86_64-linux-gnu.so,

2019-11-07

presto-cli-0.223-executable.jar

presto-cli-0.223-executable.jar

2019-11-07

数据仓库规范设计.pdf

数据仓库规范设计.pdf

2019-11-04

Cloudera Manager-V5.13 元数据库梳理.pdf

Cloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdfCloudera Manager-V5.13 元数据库梳理.pdf

2019-10-30

基础算法-LP算法_线性规划问题.pptx

基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx

2019-10-17

基础算法-递归-杨鑫20191010.pptx

基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx

2019-10-17

基础算法 - 动态规划-2019-08-01.pptx

基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx

2019-10-17

KNN实现水果分类的数据集

KNN实现水果分类的数据集KNN实现水果分类的数据集,KNN实现水果分类的数据集,KNN实现水果分类的数据集

2019-10-17

机器学习算法-神经网络LSTM

机器学习算法-神经网络.pptx

2019-09-21

ML-朴素贝叶斯-2019-07-01.pdf

ML-朴素贝叶斯-2019-07-01.pdf

2019-07-02

udfs-2.0.4-SNAPSHOT.jar

Presto的UDF函数,基本可以覆盖Hive的大多数情况。

2019-06-26

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

2019-03-06

Presto资源管理Rest API 文档

Presto资源管理Rest API 文档

2018-12-01

ACM学习路线导图

ACM学习路线导图

2018-11-14

Hadoop ResourceManager API

Hadoop ResourceManager API

2018-11-07

Kylin调研报告

Kylin (MOLAP - Multidimensional OnlineAnalytical Processing)调研报告

2018-10-29

ALL in python学习PPT

ALL in python学习PPT

2018-10-28

presto-cli

presto-cli,presto-cli,

2018-10-22

python pep8编码规范

python pep8编码规范

2018-10-17

Confluence-5.6.6-language-pack-zh_CN.jar

Confluence-5.6.6-language-pack-zh_CN.jar,防止confluence乱码的jar包

2018-09-30

AzkabanAPI接口文档汇总

AzkabanAPI接口文档汇总

2018-09-26

MachineLearning-相似度距离公式

MachineLearning-相似度距离公式

2018-09-21

Azkaban元数据库分析

Azkaban元数据库分析,

2018-09-19

Goods: Organizing Google’s Datasets

Goods: Organizing Google’s Datasets,Goods: Organizing Google’s Datasets

2018-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除