自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 HttpServletRequest常用获取URL的方法

1、getRequestURL()返回的是完整的url,包括Http协议,端口号,servlet名字和映射路径,但它不包含请求参数。2、request.getRequestURI()得到的是request URL的部分值,并且web容器没有decode过的3、request.getContextPath()返回 the context of the request. 4、request.getServletPath()Returns the part of this request's URL that c

2011-04-22 11:43:00 178849 4

原创 crontab执行脚本中文乱码,手动执行没有问题

<br />产生原因:<br />      这是因为Unix/Linux下使用crontab时的运行环境已经不是用户环境了,因此原本用户下的一些环境变量的设置就失效了。例如原来用户环境变量设置的是GB2312,但是使用crontab运行时的环境变量就可能是ISO8859-1。<br /> <br />解决方法:<br />      首先执行命令echo $LANG,假设输出是en_US.UTF-8<br />      然后在脚本中增加一行export LANG=en_US.UTF-8<br /> 

2011-03-19 17:31:00 11610 3

原创 url参数中的中文乱码问题

在用标签时,如果url参数是中文,会出现乱码问题。解决方案是:String para = new String( request.getParameter("para").getBytes("iso8859-1"), "utf-8");具体的原因是: tomcat 默认使用 iso8859-1 进行编码,所以需要先对取得字符串按照 iso8859-1 进行解码转换,然后再按照 utf-8 进行编码,最后得到正确的内容。 这里的编码方式与jsp页面编码方式一致,如果jsp是gb2312,那么代码改成Strin

2011-03-18 10:00:00 1095

转载 ActionForm中文乱码问题解决方案

原文链接http://www.cnblogs.com/cookies9/archive/2011/01/09/1931312.html就是在一个JSP页面接收ActionForm的属性时,如果输入的是中文,那么在ActionForm接收后会是乱码解决方案有2个:1.在Action类中解决,这个我试过,不可行2.在ActionForm中解决,这个我试过,可行,而且很方便在ActionForm中的reset方法中加入如下代码即可,可输出英文或中文view sourceprint?1publicvoidreset

2011-03-02 15:24:00 1354

转载 pageEncoding和contentType的区别

pageEncoding在JSP标准的语法中,如果pageEncoding属性存在,那么JSP页面的字符编码方式就由pageEncoding决定,否则就由contentType属性中的charset决定,如果charset也不存在,JSP页面的字符编码方式就采用默认的ISO-8859-1。ContentTypeContentType属性指定了MIME类型和JSP页面回应时的字符编码方式。MIME类型的默认值是“text/html”; 字符编码方式的默认值是“ISO-8859-1”. MIME类型和字符编码方

2011-03-02 15:20:00 916

原创 MyEclipse的Package Explorer中工程前面的红色感叹号是怎么回事

<br />导入一个web project到MyEclipese中,在Package Explorer中工程前面有一个红色感叹号,查看子目录下面没有任何符号。<br />原因出在引用包上。在工程名上面右键,选择Properties->Java Build Path,把前面带红色感叹号的包删除重新导入就好了。

2011-02-22 15:16:00 14140 10

原创 java.lang.NoSuchMethodError: org.apache.log4j.Category.log

<br /> 启动tomcat时报错:java.lang.NoSuchMethodError: org.apache.log4j.Category.log(Ljava/lang/String;Lorg/apache/log4j/Level;Ljava/lang/Object;Ljava/lang/Throwable;)V at org.apache.commons.logging.impl.Log4JCategoryLog.error(Log4JCategoryLog.java:149)开始一直以为是

2011-01-13 11:18:00 7774 2

转载 STRUTS 2.2.1报错,启动不了

严重: Dispatcher initialization failedjava.lang.RuntimeException: java.lang.reflect.InvocationTargetException at com.opensymphony.xwork2.inject.ContainerImpl$MethodInjector.inject(ContainerImpl.java:295) at com.opensymphony.xwork2.inject.ContainerImpl$

2011-01-13 11:00:00 5223 2

转载 解决MySQL-Front连接MySQL出现1045错误

用MySQL-Front连接远端的MYSQL出现1045错误:"Access denied for user root@162.105.67.62,请检查用户名和口令"。根据网上的介绍,通过命令mysql> use mysql;mysql> select host,user from user;得到如下结果+---------------+------+| host | user |+---------------+------+| localhost | root |+----------

2011-01-05 16:49:00 18052

原创 解决java.io.Writer cannot be resolved问题

      从cvs上导出一个项目,出现了The type java.io.Writer cannot be resolved. It is indirectly referenced等很多莫名其妙的问题,首先想到是编码的问题,修改为utf-8之后还是不行。      在网上一顿搜索,终于找到了问题所在,(参考网址http://www.activeobjects.no/subsonic/forum/viewtopic.php?t=898),应该要把项目的jdk改为6.0。      查看一个项目的jdk的方

2011-01-05 16:39:00 1700

原创 geronimo 2.1.4 failed to start

启动geronimo 2.1.4时出现异常,控制台输出java.net.BindException: Address already in use: JVM_Bind ,显示端口1050被占用.解决方法:在命令行里输入netstat -ano,查看端口为1050的进程号.然后在命令行里输入tasklist,查看哪个进程占用了该端口.之后,可以根据进程名去任务管理器中终止该进程,或者

2010-04-16 11:14:00 1127 1

原创 如何搭建struts平台

1、下载struts包      下载网址http://struts.apache.org/download.cgi,建议下载Full Distribution。2、导入jar包 新建一个Dynamic Web Project,把下载的struts文件夹下lib里的jar包commons-logging-1.1.jarfreemarker-2.3.8.jarognl-2.6

2010-04-15 18:59:00 928

原创 [解决]打开tomcat-6.0.18的startup.bat后,DOS窗口一闪就关闭了

 因为dos窗口一闪就关闭了,log文件夹也是空的,没法看到错误信息。因此,可以打开startup.bat,在最后一行:end前面加上一句pause,这样,窗口就不会自动关闭,可以查看到出错信息。例如我的输出信息说JAVA_HOME路径有问题,找不到jdk,到环境变量里修改JAVA_HOME,之后再启动就没问题了。

2010-04-15 11:33:00 4504

原创 jdk和tomcat环境变量设置

1、安装jdk之后,只需要修改三个环境变量。     找到 我的电脑——属性——高级——环境变量——系统变量,增加一个变量Java_Home,值是jdk的安装路径,如C:/Program Files/Java/jdk1.5.0_06,在path后面增加;C:/Program Files/Java/jdk1.5.0_06/bin,在classpath后面增加;C:/Program Files/J

2010-04-13 11:14:00 981

原创 修改http和https的端口号

1、修改http的端口      打开$HTTPD_HOME/conf/httpd.conf文件,找到Listen,后面紧跟的是端口号,默认是80,把它修改为你想设置的端口号即可。     如果不知道Apache的安装目录,可以用locate httpd.conf命令来查找。2、修改https的端口      打开$HTTPD_HOME/conf/extra/httpd-ssl.c

2010-03-12 16:19:00 71441

转载 Rose 7 安装运行提示 未找到 suite objects.dll 解决方法

 版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://b0r0j0.blogbus.com/logs/6844601.html安装Rose 7很顺利,未下载的朋友可以到emule里下载。运行Rose 提示错误: 未找到 suite objects.dll 我在XP上安装的目录是D:/Program Files/Rationalsuite objects

2009-11-27 08:46:00 1910

转载 用Rational Rose逆向工程(java)生成类图

 http://hi.baidu.com/suofang/blog/item/b4190de9846ea53eb80e2d1e.html 拿到了项目框架工程代码却没有uml图,那么方法之间的调用关系功能流转就不容易看出来,那么如何产生类图呢?1.新建一个ROSE工程,选择J2EE模板,2.如图 3.在出现的界面中,CLASSPATH中加入源代码的目录,加入支持的包,点

2009-11-24 11:08:00 6010 1

原创 在lucene的ranking算法中使用Language Model

 最近,网体作业要求改进Lucene的ranking算法,我使用了语言模型来进行改进,下面都是我个人的想法,很多地方还不成熟。Lucence的ranking算法是基于VSM模型的,把文档和查询表示成向量空间模型中的向量,通过计算向量之间的余弦值来给文档排序。在这里,ranking算法使用Language Model来替代。1、Language Model的思想把query的产生

2009-11-24 08:59:00 2476

转载 lucene中的ranking算法

 http://www.blogjava.net/tim-wu/archive/2008/02/09/179504.html 说明见Similarity.java的javadoc信息(http://lucene.apache.org/java/2_3_2/api/core/overview-summary.html):算法请参考javadoc的,它使用的是Vector Space Mo

2009-11-15 14:14:00 1429

转载 Heritrix 架构

 Heritrix项目介绍Heritrix工程始于2003年初,IA的目的是开发一个特殊的爬虫,对网上的资源进行归档,建立网络数字图书馆。在过去的6年里,IA已经建立了400TB的数据。 IA期望他们的crawler包含以下几种:宽带爬虫:能够以更高的带宽去站点爬。主题爬虫:集中于被选择的问题。持续爬虫:不仅仅爬更当前的网页还负责爬日后更新的网页。实验爬虫:对爬虫技术进

2009-11-15 14:09:00 1996

转载 开发自己的搜索引擎——Lucene 2.0+Heriterx—— Heritrix的使用入门

 http://book.csdn.net/bookfiles/312/10031212848.shtml Lucene很强大,这点在前面的章节中,已经作了详细介绍。但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引

2009-11-15 13:46:00 2784

转载 开发自己的搜索引擎——Lucene 2.0+Heriterx——Heritrix的架构

 http://book.csdn.net/bookfiles/312/10031212849.shtml10.2  Heritrix的架构在上一节中,详细介绍了Heritrix的使用入门。读者通过上一节的介绍,应该已经能够使用Heritrix来进行简单的网页抓取了。那么,Heritrix的内容究竟是如何工作的呢?它的设计方面有什么突出之处?本节就将介绍Heritrix的几个主要组件,

2009-11-15 13:40:00 2369

原创 Heritrix源码分析——isUrlVisited和politeness

一、isUrlVisited这主要是在Frontier里实现的,当一个链接要进入等待队列时需要先判断是否已经被抓取过,如果已经抓取过则不进入,否则进入。其中最重要的部分就是存储已抓取url的结构。为了提高效率,Heritrix在内部使用了Berkeley DB,BdbFrontier是唯一个具有实际意义的链接工厂。Heritrix中涉及存储url的主要的类有UriUniqFilter、

2009-11-15 13:23:00 3190

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除