- 博客(11)
- 资源 (5)
- 收藏
- 关注
原创 验证日期的正则表达式及其注释(包含闰年验证)
1.验证日期的正则表达式加入闰年的判断以及思路分析进入正题之前,我们需要澄清两个概念:一,什么是合法的日期范围?对于不同的应用场景,这个问题有不同的解释。这里采纳MSDN中的约定:DateTime 值类型表示值范围在公元(基督纪元)0001 年 1 月 1 日午夜 12:00:00 到公元 (C.E.) 9999 年 12 月 31 日晚上 11:59:59 之间的日期和时间。...
2012-07-23 13:57:06 225
原创 DBCP1.2.2阻塞Tomcat线程BUG
jconsole分析线程堆栈,jvi跟踪线程运行情况,分析得出连接问题,并且网上找到了问题的BUG https://issues.apache.org/jira/browse/DBCP-226 http://stackoverflow.com/questions/4853732/blocking-on-dbcp-connection-pool-open-and-close-conn...
2012-07-19 16:37:38 230
查看系统线程堆栈JSP(模仿JSTACK)
由于我们很多系统采用Windows服务启动方式,这样一来,对JVM的监控工具(比如Jconsole等)就无法使用了,那好吧,自己做个JVM进程内部 即便是Windows服务启动也可以查看系统堆栈的工具 吧! <%@ page language="java" contentType="text/html; charset=UTF-8" isErrorPage="true" ...
2012-07-18 14:14:24 132
原创 利用awstats分析tomcat日志
1.下载 ActivePerl:地址: http://downloads.activestate.com/ActivePerl/releases/5.12.2.1202/ Awstats下载:http://sourceforge.net/projects/awstats/files/AWStats/6.95/awstats-6.95.zip 根据安装包提示安装perl,解压a...
2012-07-18 13:19:24 137
原创 使用Lambda Probe监控Tomcat
Lambda Probe 是基于 Web + AJAX 的强大的免费开源工具,拥有几乎所有Tomcat Manager的功能,可以说是一个增强版本的 Tomcat Manager。除此之外,Tomcat Probe 还拥有很多让开发者和系统管理者更方便的性能。从而使得Tomcat对开发者和管理者更加透明。包括应用程序、数据源、发布、日志、线程、集群、系统信 息、状态、连接器状态这些功能。如配合 J...
2012-07-18 12:09:16 1627
原创 两种识别Excel流类型方法
private static final int _32MB = 32 * 1024 * 1024; public static DataIterator getExcelDataIterator(InputStream is, int sheetIndex) throws Exception { is = new BufferedInputStream(is);...
2012-07-16 15:15:29 231
关于饿汉式单例首次初始化失败后,可以再次尝试?
思考一个问题,以下代码是一个简单的饿汉式单例代码,显然在第一次初始化的时候会发生错误,导致单例的实例化失败,那么失败后可否继续尝试实例化呢?还是说下次使用时直接返回错误的对象或异常呢? 环境HotSpotJVM 1.6 /**** @author lidongbo* @date 2012-7-11*/public class Foo { pri...
2012-07-11 15:14:41 184
由ApacheCommon-BeanUtils1.8.3发现的Java HotSpot(TM)的Bug
由ApacheCommon-BeanUtils1.8.3发现的Java的Bug org.apache.commons.beanutils.BeanUtils.copyProperties(Object dest, Object orig) throws IllegalAccessException, InvocationTargetException 我...
2012-07-03 15:42:49 101
原创 simhash与重复信息识别
随着信息爆炸时代的来临,互联网上充斥着着大量的近重复信息,有效地识别它们是一个很有意义的课题。例如,对于搜索引擎的爬虫系统来说,收录重复的网页是毫无意义的,只会造成存储和计算资源的浪费;同时,展示重复的信息对于用户来说也并不是最好的体验。造成网页近重复的可能原因主要包括: 镜像网站内容复制嵌入广告计数改变少量修改一个简化的爬虫系统架构如下图所示: 事实上,传统比较两个...
2012-07-03 13:30:49 80
原创 Simhash算法原理和网页查重应用
传统的hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别极大。从这个意义上来说,要设计一个hash算法,对相似的内容产生的签名也相近,是更为艰难的任务,因为它的签名值除了提供原始内容是否相...
2012-07-03 12:05:18 125
原创 闰秒导致jenkins构建过程缓慢
闰秒导致部分Linux服务器高CPU使用率 国际地球自转和参考坐标系统服务(IERS)在2012年6月30日午夜(北京时间7月1号7点59分59秒)增加一闰秒(即出现 7:59:60)。由于Linux kernel 2.6.29之前版本存在bug,在进行闰秒调整时可能会引起系统时钟服务ntpd进程死锁。Debian Lenny、RHEL/CentOS 5等旧发行版今天仍被广泛使...
2012-07-03 09:56:41 1254
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人