- 博客(20)
- 资源 (2)
- 收藏
- 关注
转载 【转】 Apache Common HttpClient使用之七种武器
1.拳头之Get/Post 拳头是最基本的一重武器,也是最重要的,好比练武之人必须先扎稳马步。 java 代码 HttpClient httpclient=new HttpClient();//创建一个客户端,类似打开一个浏览器 GetMethod getMethod=new GetMethod("http://www.blablabla.com");//创建一个get方
2012-02-23 11:39:08
637
1
转载 【转】 BM 25 模型的学习
MB (Basic Model | Best Matching)25 模型,是二元独立模型的扩展,其得分函数有很多形式。 转自:http://ipie.blogbus.com/logs/104136815.html BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性
2012-01-03 04:49:04
864
原创 初识java泛型擦除
今天coding的时候遇到一个错误:"Cannot instantiate the type ..." 网上查了多数情况会出现在实例化一个抽象类,但是这里是试图实例化泛型。 public class TestEraser { public void t () { T t = new T(); } } 参考了别人的博客,讲解得很详细: http://blog.csdn
2011-12-12 22:15:22
483
原创 java编程调用 windows命令行
之前一个项目用到了java调用命令行程序。 其实jdk已经把调用的方法封装的很好了。但毕竟是沙箱之外的程序,资源的清理工作不做好,系统很快就会崩溃。还是有很多细节处需要小心处理 java.lang.Process抽象类封装一个本机进程。 Process proc
2011-09-01 00:20:06
1899
原创 转: JUnit 4 in 60 seconds 中文
很简洁的一个入门。 原文地址 : http://www.cavdar.net/2008/07/21/junit-4-in-60-seconds/ 我转载的中文来源: http://www.huomo.cn/developer/article-514c.html
2011-08-23 21:33:39
348
原创 jquery初尝试
初识jquery,被它的选择器、不唐突的HTML风格等所吸引。 今天记录开始使用遇到的一些问题: 1) 短时间内,多次点击按钮,但不能正确提交 这是由于浏览器的缓存影响。在页面顶端meta里设置也没有用。 当使用GET方式时要添加时间戳参数 (ne
2011-08-18 15:23:02
321
原创 继续关于Java String的字符串不变性和public String(String original);
String的subString方法,并没有创建一个新的字符数组,只是将offset和count换到了对应的地方。这样就产生了内存泄露的一个隐患——原来完整的字符串仍然被新的String引用所指向。例如:从爬取下来的网页中,抽取出其标题,并将标题存入到一个HashMap中,实际上整个网页字符串都不会被清除。随着时间推移,你可能在内存中保存下来了所有的被下载到的网页。这样,就可以理解利用String来构造String的意思了——public String(String original);如果试图构造的Str
2011-05-16 15:25:00
703
原创 记录两个BUG
<br />一个爬虫程序在运行一段时间之后就假死了。在jconsole的线程标签页中,点击“检测到死锁”也报告“未检测到死锁”。<br /> <br />但是仔细查看jconsole中每个线程的状态,观察它们的堆栈追踪,发现我的程序启动的进程都在“java.net.SocketInputStream.socketRead0”处等待。意识到是在这个地方程序阻塞,且没有超时退出。<br /> <br />将这个在网上一搜,发现httpclient确实有人报告这个问题:http://mail-archives.a
2011-05-10 20:46:00
355
原创 顶礼膜拜大牛的java内存分析
<br />http://jarfield.javaeye.com/blog/583946<br /> <br />工具先进,分析透彻,问题解决。<br /> <br />顶礼膜拜,以资感谢!
2011-03-06 18:16:00
504
原创 ICTCLAS09的使用记录
<br />ICTCLAS09 共享版各种问题。<br /> <br />试用期到了,报错。<br /> <br />多线程之间的实例共享,会报错。<br /> <br />多个实例之间,关闭打开的顺序不对,还会报错。这样是可以的ICTCLAS30 seg1 = new ICTCLAS30(); if (seg1.ICTCLAS_Init(Configuration.getInstance().getICTCLAS_CONFIGURATION_FILE().getBytes("GBK")) == fa
2011-02-27 15:42:00
755
原创 Hibernate——MyEclipse配置hibernate——入门
之前由于各种惰性,各种理由,不肯转向hibernate。终于撞到南墙了,而今迈步从头越!继续从hello,world开始吧。新建工程。右键->MyEclipse->add Hibernate Capacities,各种基本配置,next直到Finish。Window->Show View->DB Brower,对需要和程序交互的表格 右键->Hibernate Reverse Engineering,勾选上三个选择框——分别对应生成“映射文件”,数据类,数据存储操作类,进一步next,配置各种映射关系,直到
2010-11-20 16:49:00
465
原创 怀疑自己怀疑java
<br />自己写的java定向采集程序一次又一次的假死。<br /> <br />通过各种内存工具,发现是自己的Statement和ResultSet管理有误,资源各种没有被合理回收。小心翼翼的将所有需要关闭的资源关闭掉。增加了大量睡眠时间以留给GC回收垃圾(定向采集,不能给对方服务器太大的压力么~~)。<br /> <br />后来又遇到proxy连接池链接超时、mysql数据库连接使用超时;咬牙去掉proxy,再跑程序又假死——估计还是链接被占用光,资源申请死锁了。<br /> <br />和同学讨论
2010-11-20 16:34:00
375
原创 关于java内存
Eclipse也是在JVM上运行的,所以修改eclipse.ini文件中的配置,只是修改了运行eclipse IDE的这个JVM的运行参数。也就是说,如果修改eclipse.ini为-showsplashorg.eclipse.platform--launcher.XXMaxPermSize256m-vmargs-Xms40m-Xmx256m表示,启动JVM运行eclipse时,设置最大perm size为256M,堆最小为40M,最多分配256M。一般情况下,这个配置运行这个eclipse IDE是足够
2010-11-09 16:42:00
382
原创 Java Regular Expression 捕获组重复
<br />JDK1.6中关于捕获组重复的问题的描述:<br /> <br />The captured input associated with a group is always the subsequence that the group most recently matched. <br /> <br />If a group is evaluated a second time because of quantification then its previously-captured
2010-10-26 14:55:00
586
1
原创 Lucene 3.0.2 Analyzer TokenStream AttributeSource Attribute AttributeImp
public static void main(String[] args) throws Exception{ LowerCaseTokenizer s = new LowerCaseTokenizer(new FileReader(new File("c://t.txt"))); TermAttribute t = s.getAttribute(TermAttribute.class); // map of the class name and the obj
2010-10-12 12:58:00
529
原创 资源池管理代码
<br />直接贴代码了。就两个类、两个文件。<br /> <br /> <br />package resourcePool;<br /><br /> import java.io.IOException;<br /><br /> /**<br /> * this interface describes a factory producing some kind of resource,<br /> * such as data base connection, networking conn
2010-09-06 17:36:00
334
原创 字符编码
<br /><br />首先需要整明白两个概念:字符集、字符集编码。<br />清楚Unicode是字符集,在字符集中,每个字符只有编号,也称为码点。UTF-16是Unicode字符集的一种编码,UTF-8是同一字符集的另一种编码。<br /> <br />参考:<br />http://hi.baidu.com/%B0%AE%D0%C4%CD%AC%C3%CB_%B3%C2%F6%CE/blog/item/31bf18a2306cc5a7cbefd0c8.html<br /> <br /> <br />有
2010-08-26 16:15:00
371
原创 初次使用Boost Regex
<br />让我这个Java程序员再去搞C++真是折磨,看到那些lib dl hpp cppl就头疼。。。<br /> <br />实验室要求,不能不搞。用boost,做正则表达式。小小记录一下我顺利的安装使用过程,以防迅速忘记了……<br /> <br />下载对应平台的boost,<br /> <br />双击bootstrap.bat<br /> <br />吃饭去,回来看到编译已经完成,目录下多了一个bin.v2目录,里面是各种库文件<br /> <br />在vs2005中,<br />工具-->
2010-08-25 15:29:00
384
原创 Java 中的String
Java 中的String字符串常量池:在堆中开辟出来的一块内存 创建字符串:1. 用简单方法创建:String s1 = “String”; String s2 = “String”;创建s1的时候,因池中没有”String” ,故在字符串常量池中创建之,并使s1指向它创建s2的时候,在池中搜索到”String”,故直接将s2指向它 2.
2008-04-21 20:01:00
449
模式识别——系统聚类法
2009-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人