自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

单向街的夏天

学海无涯备忘录,每天进步一点点,后续更新请见 www.xiutx.cn

  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

转载 如何确定中文字符串的相似度

摘要在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。本文综合作者的实际工作经验和数据挖掘理论,结合中文字符串特性介绍一套相对完整的方法,以解决上述问题.。 分析     最简单的问题求解       字符串由一组不同含义的单词组成,它不同于数值型变量,可以用一个特定的数值来确定它的

2013-04-27 22:21:40 4773

转载 由浅入深探究mysql索引结构原理、性能分析与优化

摘要:第一部分:基础知识第二部分:MYISAM和INNODB索引结构1、 简单介绍B-tree B+ tree树2、 MyisAM索引结构3、 Annode索引结构4、 MyisAM索引与InnoDB索引相比较第三部分:MYSQL优化1、表数据类型选择2、sql语句优化(1)     最

2013-04-20 21:46:20 1017

转载 字符,字节和编码(精华篇)

字符,字节和编码转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm]级别:中级摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱

2013-04-20 20:16:18 702

转载 Lucene学习总结(二):lucene的包结构和工作流程

Lucene是有索引和搜索的两个过程,包含索引创建,索引,搜索三个要点。让我们更细一些看Lucene的各组件: 被索引的文档用Document对象表示。IndexWriter通过函数addDocument将文档添加到索引中,实现创建索引的过程。Lucene的索引是应用反向索引。当用户有请求时,Query代表用户的查询语句。IndexSearcher通过函数search搜索L

2013-04-16 22:08:49 1172

转载 Lucene学习总结(一):全文检索的工作流程

一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或

2013-04-16 22:02:52 1096

原创 Lucene分词实现---Analyzer、TokenStream(Token、Tokenizer、Tokenfilter)

一  分清概念:   1   TokenStream是用来走访Token的iterator(迭代器) ,              Tokenizer继承自TokenStream,其输入为Reader 。             TokenFilter继承自TokenStream,其作用是用来完成对TokenStream的过滤操作,譬如 去StopWords,将Token变为小

2013-04-16 13:59:32 2243

原创 MYSQL中常用命令

(一)连接到远程主机上的MYSQL的命令      命令行各参数的含义:                  mysql-h (host--IP地址) -P (port端口,默认3306)-u (用户名root)-p(password) -D(database,  指定数据库)      mysql连接本地远程数据库命令范例:

2013-04-15 14:20:09 1111

原创 数据库表的连接用法详解(Left join , Right Join, Inner Join)

连接查询 通过连接运算符可以实现多个表查询。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。 在 关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当检索数据时,通过连接操作查询出存放在多个表中的不 同实体的信息。连接操作给用户带来很大的灵活性,他们可以在任何时候增加新的数据类型。为不同实体创建新的表,尔后通过连接进

2013-04-11 09:31:18 5434

深入虚拟机---JVM调优总结(摘自网上网上大牛分享).pdf

深入虚拟机---JVM调优总结(摘自网上网上大牛分享),主要是详细介绍了gc的收集,觉得不错。

2013-07-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除