java
文章平均质量分 59
haha0515
这个作者很懒,什么都没留下…
展开
-
java linkedlist 算法笔记一
自我理解java linkedlist插入数据的算法:首先看一下,linkedlist插入源代码:public class LinkedList extends AbstractSequentialList implements List, Deque, Cloneable, java.io.Serializable{ private transient ...原创 2010-01-04 19:08:40 · 98 阅读 · 0 评论 -
[转]IBM 加入 OpenJDK 项目
转自:http://www.oschina.net/news/12395/ibm-join-openjdk-effort?from=rss 多年缺席后,IBM现在加入甲骨文为首的开源OpenJDK的项目。OpenJDK 是一个开源Java平台的参考实现。 如今 IBM 终于也加入了这个项目,这是原来Sun公司无法做的事。甲骨文正在帮助巩固其作为Java社区的领导地位。IBM公司新...原创 2010-10-12 09:52:59 · 134 阅读 · 0 评论 -
判断文件字符集的简单方法
/** * * ANSI: 无格式定义; * Unicode: 前两个字节为FFFE * Unicode big endian: 前两字节为FEFF * UTF-8: 前两字节为EFBB * @param file * @return */ public static String g...原创 2010-09-17 15:17:33 · 305 阅读 · 0 评论 -
合并排序
合并排序属于稳定排序的一种,也是一种外部排序。一般用户文件排序,空间复杂度为O(n)package algorithms;/** * 合并排序 * @author heng * @date 2010-6-26 */public class MergeSort { public static void main(String[] args) { int[...原创 2010-06-27 13:31:47 · 96 阅读 · 0 评论 -
【转】从HTML文件中抽取正文的简单方案
原文转载自http://blog.csdn.net/lanphaday/archive/2007/08/13/1741185.aspx根据上面所说,我写了一个页面降噪的测试类,确实有效,不过对于不同网页,可能结果有偏差,特别网页文字比较少的,例如图片于文字混合的主题正文页面,等等。package com.test.net;import java.io.BufferedReader;...原创 2010-08-25 14:36:45 · 91 阅读 · 0 评论 -
文档相似度计算
最近在做爬虫时的一点点心德,记录下来。文档相似度计算,一般常用的就是余弦定理,代表性介绍的文章有:google黑板报的数学之美系列十二 -- 余弦定理和新闻的分类(这个是网上的一遍原文转载,google的黑板报被河蟹了) 把文档量化然后通过余弦定理计算相似度,主要适用于爬虫的聚类统计,和文档分类,是一种比较简单的分类算法: /** * 计算文档相似度 ...原创 2010-08-23 00:46:39 · 524 阅读 · 0 评论 -
睡不着写算法(二)
循环链表package algorithms;/** * 链表 * @author henry * @date 2010-06-04 1:06:22 */public class MyLinkedList { private static MyNode myNode; private static int size = 0; public My...2010-06-04 01:01:40 · 79 阅读 · 0 评论 -
睡不着写算法(一)
二分查找,和快排。过几天比较下快排和插入排序,两个的效率。package algorithms;/** * 快排,递归二分查找 * @author henry * @date 2010-06-04 1:04:10 */public class RbSearch { public static int[] a = { 11, 22, 44, 5, 0, 3,...2010-06-04 00:59:58 · 81 阅读 · 0 评论 -
持久化list
简单的做了持久化list的操作,方便网络传输数据,待时日可扩展为持久化队列系统或nosql数据库。为自主开发的的nosql作准备,以此为记:package com.test.list;import java.io.ByteArrayInputStream;import java.io.ByteArrayOutputStream;import java.io.FileNotFou...2010-08-16 17:02:23 · 449 阅读 · 0 评论 -
代码日记--lucene3.0.1
/** * Returns a DocIdSet with documents that should be * permitted in search results. */ @Override public DocIdSet getDocIdSet(IndexReader reader) throws IOException { final Ter...原创 2010-05-14 17:40:46 · 89 阅读 · 0 评论 -
优先队列--Java
优先队列的java实现注:当时写好之后忘了检查,这个优先队列有点缺陷~~~嘻嘻,不过我在工作环境中已经作了修改package test;import java.util.Comparator;/** * @作用:优先队列 * @author henry * @date 2010-4-30 */public class PriQueue<E> ...2010-04-30 15:51:57 · 91 阅读 · 0 评论 -
Mysql连接超时解决办法(mysql-jdbc)
mysql的超时后,其实不用修改mysql的配置。那样做其实会使mysql存在很大的安全问题。mysql-jdbc有个很好的解决办法,如果出现连接超时,可以判断后自动重连/** * 判断连接是否有效 * @param conn * @return boolean */ private boolean checkConnection(Connection conn...2010-04-21 14:35:10 · 714 阅读 · 0 评论 -
openfire,flash连接失败修改~测试通过
新的flash播放器加入了跨域名访问安全机制。在跨域名访问时,flash播放器会发送一条信息:<policy-file-request/>必须要接受一条xml策略信息才能通过验证。 要flash播放器通过安全验证可以在ConnectionManager中的ConnectionHandler类加入如下代码if(xmlpolicy1.equals("<po...2010-04-21 14:27:58 · 130 阅读 · 0 评论 -
【转】k-means聚类算法的java实现描述
从网上找到了很多定义,这里选取比较典型的几个;K-Mean 分群法是一种分割式分群方法,其主要目标是要在大量高纬的资料点中找出 具有代表性的资料点;这些资料点可以称为群中心,代表点;然后再根据这些 群中心,进行后续的处理,这些处理可以包含1 )资料压缩:以少数的资料点来代表大量的资料,达到资料压缩的功能;2 )资料分类:以少数代表点来代表特点类别的资料,可以降低资料...2010-04-21 14:14:15 · 108 阅读 · 0 评论 -
XXX
此文章封闭!原创 2010-01-19 09:54:05 · 142 阅读 · 0 评论 -
[转]java正则表达式匹配标点符号
str = str.replaceAll("[\\pP‘’“”]", ""); Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。其他六个是L:字母;M:标记符号(一般不会单独...原创 2013-08-15 10:30:38 · 2077 阅读 · 0 评论