自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(20)
  • 资源 (2)
  • 收藏
  • 关注

转载 【转】 Apache Common HttpClient使用之七种武器

1.拳头之Get/Post 拳头是最基本的一重武器,也是最重要的,好比练武之人必须先扎稳马步。 java 代码   HttpClient httpclient=new HttpClient();//创建一个客户端,类似打开一个浏览器   GetMethod getMethod=new GetMethod("http://www.blablabla.com");//创建一个get方

2012-02-23 11:39:08 637 1

转载 【转】 BM 25 模型的学习

MB (Basic Model | Best Matching)25 模型,是二元独立模型的扩展,其得分函数有很多形式。 转自:http://ipie.blogbus.com/logs/104136815.html BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性

2012-01-03 04:49:04 864

原创 初识java泛型擦除

今天coding的时候遇到一个错误:"Cannot instantiate the type ..." 网上查了多数情况会出现在实例化一个抽象类,但是这里是试图实例化泛型。 public class TestEraser { public void t () { T t = new T(); } } 参考了别人的博客,讲解得很详细: http://blog.csdn

2011-12-12 22:15:22 483

原创 java编程调用 windows命令行

之前一个项目用到了java调用命令行程序。 其实jdk已经把调用的方法封装的很好了。但毕竟是沙箱之外的程序,资源的清理工作不做好,系统很快就会崩溃。还是有很多细节处需要小心处理 java.lang.Process抽象类封装一个本机进程。 Process proc

2011-09-01 00:20:06 1899

原创 转: JUnit 4 in 60 seconds 中文

很简洁的一个入门。 原文地址 : http://www.cavdar.net/2008/07/21/junit-4-in-60-seconds/ 我转载的中文来源: http://www.huomo.cn/developer/article-514c.html

2011-08-23 21:33:39 348

原创 jquery初尝试

初识jquery,被它的选择器、不唐突的HTML风格等所吸引。 今天记录开始使用遇到的一些问题: 1) 短时间内,多次点击按钮,但不能正确提交 这是由于浏览器的缓存影响。在页面顶端meta里设置也没有用。 当使用GET方式时要添加时间戳参数 (ne

2011-08-18 15:23:02 321

原创 继续关于Java String的字符串不变性和public String(String original);

String的subString方法,并没有创建一个新的字符数组,只是将offset和count换到了对应的地方。这样就产生了内存泄露的一个隐患——原来完整的字符串仍然被新的String引用所指向。例如:从爬取下来的网页中,抽取出其标题,并将标题存入到一个HashMap中,实际上整个网页字符串都不会被清除。随着时间推移,你可能在内存中保存下来了所有的被下载到的网页。这样,就可以理解利用String来构造String的意思了——public String(String original);如果试图构造的Str

2011-05-16 15:25:00 703

原创 记录两个BUG

<br />一个爬虫程序在运行一段时间之后就假死了。在jconsole的线程标签页中,点击“检测到死锁”也报告“未检测到死锁”。<br /> <br />但是仔细查看jconsole中每个线程的状态,观察它们的堆栈追踪,发现我的程序启动的进程都在“java.net.SocketInputStream.socketRead0”处等待。意识到是在这个地方程序阻塞,且没有超时退出。<br /> <br />将这个在网上一搜,发现httpclient确实有人报告这个问题:http://mail-archives.a

2011-05-10 20:46:00 355

原创 单solr在tomcat下的安装

单 solr 3.1在tomcat 6.0下安装

2011-05-03 16:22:00 434

原创 顶礼膜拜大牛的java内存分析

<br />http://jarfield.javaeye.com/blog/583946<br /> <br />工具先进,分析透彻,问题解决。<br /> <br />顶礼膜拜,以资感谢!

2011-03-06 18:16:00 504

原创 ICTCLAS09的使用记录

<br />ICTCLAS09 共享版各种问题。<br /> <br />试用期到了,报错。<br /> <br />多线程之间的实例共享,会报错。<br /> <br />多个实例之间,关闭打开的顺序不对,还会报错。这样是可以的ICTCLAS30 seg1 = new ICTCLAS30(); if (seg1.ICTCLAS_Init(Configuration.getInstance().getICTCLAS_CONFIGURATION_FILE().getBytes("GBK")) == fa

2011-02-27 15:42:00 755

原创 Hibernate——MyEclipse配置hibernate——入门

之前由于各种惰性,各种理由,不肯转向hibernate。终于撞到南墙了,而今迈步从头越!继续从hello,world开始吧。新建工程。右键->MyEclipse->add Hibernate Capacities,各种基本配置,next直到Finish。Window->Show View->DB Brower,对需要和程序交互的表格 右键->Hibernate Reverse Engineering,勾选上三个选择框——分别对应生成“映射文件”,数据类,数据存储操作类,进一步next,配置各种映射关系,直到

2010-11-20 16:49:00 465

原创 怀疑自己怀疑java

<br />自己写的java定向采集程序一次又一次的假死。<br /> <br />通过各种内存工具,发现是自己的Statement和ResultSet管理有误,资源各种没有被合理回收。小心翼翼的将所有需要关闭的资源关闭掉。增加了大量睡眠时间以留给GC回收垃圾(定向采集,不能给对方服务器太大的压力么~~)。<br /> <br />后来又遇到proxy连接池链接超时、mysql数据库连接使用超时;咬牙去掉proxy,再跑程序又假死——估计还是链接被占用光,资源申请死锁了。<br /> <br />和同学讨论

2010-11-20 16:34:00 375

原创 关于java内存

Eclipse也是在JVM上运行的,所以修改eclipse.ini文件中的配置,只是修改了运行eclipse IDE的这个JVM的运行参数。也就是说,如果修改eclipse.ini为-showsplashorg.eclipse.platform--launcher.XXMaxPermSize256m-vmargs-Xms40m-Xmx256m表示,启动JVM运行eclipse时,设置最大perm size为256M,堆最小为40M,最多分配256M。一般情况下,这个配置运行这个eclipse IDE是足够

2010-11-09 16:42:00 382

原创 Java Regular Expression 捕获组重复

<br />JDK1.6中关于捕获组重复的问题的描述:<br /> <br />The captured input associated with a group is always the subsequence that the group most recently matched. <br /> <br />If a group is evaluated a second time because of quantification then its previously-captured

2010-10-26 14:55:00 586 1

原创 Lucene 3.0.2 Analyzer TokenStream AttributeSource Attribute AttributeImp

public static void main(String[] args) throws Exception{         LowerCaseTokenizer s = new LowerCaseTokenizer(new FileReader(new File("c://t.txt")));         TermAttribute t = s.getAttribute(TermAttribute.class);     // map of the class name and the obj

2010-10-12 12:58:00 529

原创 资源池管理代码

<br />直接贴代码了。就两个类、两个文件。<br /> <br /> <br />package resourcePool;<br /><br /> import java.io.IOException;<br /><br /> /**<br />  * this interface describes a factory producing some kind of resource,<br />  * such as data base connection, networking conn

2010-09-06 17:36:00 334

原创 字符编码

<br /><br />首先需要整明白两个概念:字符集、字符集编码。<br />清楚Unicode是字符集,在字符集中,每个字符只有编号,也称为码点。UTF-16是Unicode字符集的一种编码,UTF-8是同一字符集的另一种编码。<br /> <br />参考:<br />http://hi.baidu.com/%B0%AE%D0%C4%CD%AC%C3%CB_%B3%C2%F6%CE/blog/item/31bf18a2306cc5a7cbefd0c8.html<br /> <br /> <br />有

2010-08-26 16:15:00 371

原创 初次使用Boost Regex

<br />让我这个Java程序员再去搞C++真是折磨,看到那些lib dl hpp cppl就头疼。。。<br /> <br />实验室要求,不能不搞。用boost,做正则表达式。小小记录一下我顺利的安装使用过程,以防迅速忘记了……<br /> <br />下载对应平台的boost,<br /> <br />双击bootstrap.bat<br /> <br />吃饭去,回来看到编译已经完成,目录下多了一个bin.v2目录,里面是各种库文件<br /> <br />在vs2005中,<br />工具-->

2010-08-25 15:29:00 384

原创 Java 中的String

 Java 中的String字符串常量池:在堆中开辟出来的一块内存 创建字符串:1.       用简单方法创建:String s1 = “String”; String s2 = “String”;创建s1的时候,因池中没有”String” ,故在字符串常量池中创建之,并使s1指向它创建s2的时候,在池中搜索到”String”,故直接将s2指向它 2.  

2008-04-21 20:01:00 449

模式识别——系统聚类法

模式识别中的经典非监督是算法,系统聚类法。 VS2005的工程文件包;也可以直接查看工程下的.c文件。 算法关键问题是距离矩阵的演算;而演算的关键思路是动态规划的,即(i j)元素只由i j右下的元素确定,也就是若干(t,k),其中t>=i k>=j。

2009-09-15

模式识别——K均值算法

模式识别中的经典算法,K均值算法,C语言实现,VS2005的工程文件包。也可以直接查看工程下的.c文件

2009-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除