- 博客(12)
- 收藏
- 关注
原创 SQL Server 轻松修改数据的大小写
无论是从网站、内部应用程序,还是从文件将数据输入到SQL Server系统中,数据的展示都是一个应当始终关注的问题。 【IT专家网独家】本文我们将创建一个在更新数据或以一种让人看起来顺眼的方式为终端用户展示数据方面非常有用的函数。本文的例子适用于SQL Server 2000及以上的版本。 数据展示(data presentation) 数据被源系统接收并加工...
2012-07-26 16:32:29 812 1
原创 java 加密
本篇内容简要介绍BASE64、MD5、SHA、HMAC几种加密算法。 BASE64编码算法不算是真正的加密算法。 MD5、SHA、HMAC这三种加密算法,可谓是非可逆加密,就是不可解密的加密方法,我们称之为单向加密算法。我们通常只把他们作为加密的基础。单纯的以上三种的加密并不可靠。BASE64按照RFC2045的定义,Base64被定义为:Base64内容传...
2012-07-24 14:28:44 78
原创 使用lucene PrefixQuery 根据拼音前缀查询
PrefixQuery类似于 数据库中的 like 'a%'查询以下是测试代码,这种方式的缺陷是人为的分出了更多的term,目前还在找有没有更优的方法。测试代码: public static String index_path3="D:\\ix3"; public static void main(String[]args) throws Exception{...
2012-07-17 10:52:18 215
原创 lucene 中一个Filed中包含多值的范围查询
package tools.lucene; import java.io.File; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.PerFieldAnalyzerWrapper; import org...
2012-07-17 10:50:31 128
原创 solr部署
1. 认识到solr是作为一个webapp角色;2. 找到下载solr目录dist下的war包,放到tomcat\webapps目录下面3. 启动tomcat;4. tomcat启动后会自动加载这个war包,可以看到webapps下自动生成了solr(因为我把war包名字改成了"solr")目录,打开此目录下的WEB-INF\web.xml,做以下步...
2012-07-17 10:41:11 73
原创 Solr快速教程
Solr快速教程加载及配置步骤:1.下载最新版本的Solr(当前为v1.4); 下载地址:http://lucene.apache.org/solr/ 选择resource-download下载2.解压到随便一个地方,拿出以下两个文件:解压目录/dist/apache-solr-1.4.0.war;解压目录/example/solr;确保solr目录有以下文...
2012-07-17 10:38:25 91
原创 PrefixQuery前缀搜索符合的所有放入map
/** PrefixQuery前缀搜索符合的所有放入map * @param File indexDir,索引目录; * @param String word 索引关键词前缀 * @return Map * @author niewj @since 2011-3-10 */ p...
2012-07-17 10:37:32 96
原创 转载--网页去重方法
在爬虫启动工作的过程中,我们不希望同一个网页被多次下载,因为重复下载不仅会浪费CPU机时,还会为搜索引擎系统增加负荷。而想要控制这种重复性下载问题,就要考虑下载所依据的超链接,只要能够控制待下载的URL不重复,基本可以解决同一个网页重复下载的问题。非常容易想到,在搜索引擎系统中建立一个全局的专门用来检测,是否某一个URL对应的网页文件曾经被下载过的URL存储库,这就是方案。接着要考...
2012-07-10 14:43:23 176
原创 通用 Java 文件上传和下载组件的设计与实现
概 述文件上传和下载是 Web 应用中的一个常见功能,相信各位或多或少都曾写过这方面相关的代码。但本座看过不少人在实现上传或下载功能时总是不知不觉间与程序的业务逻辑纠缠在一起, 因此,当其他地方要用到这些功能时则无可避免地 Copy / Pase,然后再进行修改。这样丑陋不堪的做法导致非常容易出错不说,更大的问题是严重浪费时间不断做重复类似的工作,这是本座绝不能容忍的...
2012-07-10 14:20:48 171
原创 产品经理如何分析互联网产品?
现在的互联网产品层出不穷,作为产品经理应该如何正确的分析其价值和定位,成为国内社区日益关注的主题之一。最近,知乎社区里的产品经理、开发人员针对“如何分析互联网产品”这一问题进行了深入的讨论。InfoQ整理了其中的精彩内容供读者参考。 徐乙®(卫哲的3+1思考法)3:需求是从哪里来的?目标客户是谁?有多少人有这样的需求?这个需求紧迫吗?他们的痛是什么?场景是什...
2012-07-10 14:20:34 92
原创 网站导航压力测试[支付宝用户研究]
针对导航进行评价的方法有很多,比如启发式评估、清单评价、可用性测试、计量分析、导航压力测试。《web导航设计》这本书中对比这些方法的优缺点:一、简介 1.导航压力测试创始人是Keith Instone 2.考察3个问题: (1)我在哪里? (2)这里有什么? (3)我可以去哪里? 二、方法 1.用户:请6...
2012-07-10 14:20:20 267
原创 转载--网页去重方法研究
搜索引擎判断复制网页一般都基于这么一个思想:为每个网页计算出一组信息指纹(Fingerprint),若两个网页有一定数量相同的信息指纹,则认为这两个网页的内容重叠性很高,也就是说两个网页是内容复制的。很多搜索引擎判断内容复制的方法都不太一样,主要是以下两点的不同:1、计算信息指纹(Fingerprint)的算法;2、判断信息指纹的相似程度的参数。在描述具体的算法前,先说...
2012-07-10 14:19:48 118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人