JAVA
Baocai3000
技术源于需求又高于需求
展开
-
计算信息增益(Information Gain),考虑交叉feature
package com.lexcotech.utils;import java.io.BufferedReader;import java.io.FileReader;import java.util.ArrayList;import java.util.Collections;import java.util.Comparator;import java.util.HashMap;原创 2012-03-30 18:05:21 · 1844 阅读 · 0 评论 -
从docx提取专利文献数据
package cn.ac.ict.word;import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.原创 2012-07-27 09:04:10 · 884 阅读 · 0 评论 -
what changes in lucene4
Pre-3.0 indices are no longer supported. MIGRATE.txt describes how to update your application code. The index format won't change (unless a serious bug fix requires it) between this release an转载 2012-07-26 11:09:41 · 1406 阅读 · 0 评论 -
正确理解ThreadLocal
//traceback:http://www.iteye.com/topic/103804首先,ThreadLocal 不是用来解决共享对象的多线程访问问题的,一般情况下,通过ThreadLocal.set() 到线程中的对象是该线程自己使用的对象,其他线程是不需要访问的,也访问不到的。各个线程中访问的是不同的对象。 另外,说ThreadLocal使得各线程能够保持各自独立的一个对转载 2012-06-18 10:27:10 · 701 阅读 · 0 评论 -
html转化生成dom
/* * Copyright 2002-2009 Andy Clark, Marc Guillemot * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You原创 2012-04-07 17:49:50 · 2429 阅读 · 0 评论 -
计算熵
package com.lexcotech.utils;import java.util.Arrays;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.Map.Entry;public class InformationGain { /** * calc原创 2012-03-30 17:07:35 · 965 阅读 · 0 评论 -
产生K-folder交叉验证的代码
static void genKFolder(String CVFolder) { try { // String[] files = { "1.0.txt", "2.0.txt", "3.0.txt", "4.0.txt", // "5.0.txt", "6.0.txt", "7.0.txt", "8.0.txt", "9.0.txt", // "10.0.txt" };原创 2012-03-28 16:11:57 · 2165 阅读 · 2 评论 -
按照年月日星期分组
String daily = "to_char(query_Date,'dd')";// 自然日 String weekly = "to_char(query_Date,'iw')";// 自然周 String monthly = "to_char(query_Date,'mm')";// 自然月 String yearly = "to_char(query_Date,'yyyy原创 2011-10-23 13:37:46 · 1127 阅读 · 0 评论 -
坑爹的struts2的命名规则
action的名称不能叫login,害得我调了一下午。原创 2011-10-21 16:45:00 · 903 阅读 · 1 评论 -
Hadoop java.net.NoRouteToHostException: No route to host
8:java.net.NoRouteToHostException: No route to host j解决方法: sudo /etc/init.d/iptables stop转载 2011-09-27 19:11:58 · 1451 阅读 · 0 评论 -
java字典序排序
import java.util.Comparator;import java.util.ArrayList;import java.util.Collections;public class Tester { public static void main(String[] args) { ArrayList list = new ArrayList(); list.add("东转载 2012-10-10 13:53:22 · 18650 阅读 · 1 评论 -
Lucene4 TokenStream
package org.apache.lucene.analysis;/* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for原创 2012-10-16 09:36:32 · 2316 阅读 · 0 评论 -
macos安装thrift
Install BoostDownload the boost library from boost.org untar compile with./bootstrap.shsudo ./b2 threading=multi address-model=64 variant=release stage installInstall libeventDownload原创 2013-09-05 13:49:29 · 1105 阅读 · 0 评论 -
C45的.data和.names文件转化成Arff数据
package cn.ac.ict.ics.utils;import lombok.Cleanup;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileReader;import java.io.IOException;import java.nio.charset.Chars原创 2013-08-21 16:21:26 · 3610 阅读 · 0 评论 -
new io for Chinse file path
@Test public void testConverter() { Path dir = Paths.get("/Users/tom/Documents/parse"); try (DirectoryStream stream = Files.newDirectoryStream(dir, "*.{json}")) { for原创 2013-08-02 11:54:32 · 734 阅读 · 0 评论 -
rabbitmq
1.download rabbit-mq server:wget http://www.rabbitmq.com/releases/rabbitmq-server/v3.1.3/rabbitmq-server-3.1.3-1.noarch.rpm download erlang:wget https://download3.vmware.com/software/vfabric/erlan原创 2013-07-24 20:50:29 · 919 阅读 · 0 评论 -
FileLock
import org.junit.Ignore;import org.junit.Test;import java.io.File;import java.io.RandomAccessFile;import java.nio.channels.FileLock;public class FileLockTest { @Test public void te原创 2013-07-03 18:41:48 · 1078 阅读 · 0 评论 -
jdk7 new api
import java.nio.charset.StandardCharsets;import java.nio.file.Files;import java.nio.file.Path;import java.nio.file.Paths;import java.util.ArrayList;import java.util.List; public class WriteText原创 2013-07-15 11:27:14 · 2074 阅读 · 0 评论 -
maven下载source和javadocs
# mvn dependency:sources# mvn dependency:resolve -Dclassifier=javadoc原创 2013-05-14 16:25:51 · 1206 阅读 · 0 评论 -
twitter storm(Stream grouping)
SplitSentence对于句子里面的每个单词发射一个新的tuple, WordCount在内存里面维护一个单词->次数的mapping, WordCount每收到一个单词, 它就更新内存里面的统计状态。有好几种不同的stream grouping:最简单的grouping是shuffle grouping, 它随机发给任何一个task。上面例子里面RandomSentenc转载 2012-11-08 19:59:54 · 1014 阅读 · 0 评论 -
memcached-client
/** * Deletes an object from cache given cache key, a delete time, and an optional hashcode. * * The item is immediately made non retrievable. * Keep in mind {@link #add(String, Object) add}转载 2012-10-20 10:58:21 · 1161 阅读 · 0 评论 -
MALLET预测
<br />public void testPredict() throws Exception { CRF crf = (CRF) FileUtils.readObject(new File("web.model")); Pipe p = makeSpacePredictionPipe(); InstanceList predictInstances = new InstanceList(p); predictInstances.addThruPipe(new LineGroupI原创 2011-03-31 10:33:00 · 946 阅读 · 0 评论 -
序列化问题
<br />public void testserialAndDesirial() throws Exception { Magazine magazine = new Magazine(); magazine.setName("1111testfucku"); ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream( "magazie")); out.writeObject(magazine原创 2011-03-29 11:05:00 · 673 阅读 · 0 评论 -
获取LABEL与构建InstanceList
<br />String[] labels = new String[crf.getOutputAlphabet().size()]; for (int i = 0; i < crf.getOutputAlphabet().size(); i++) { labels[i] = (String) crf.getOutputAlphabet().lookupObject(i); } <br /> public void testCRF() throws Exception { Pipe原创 2011-03-31 09:00:00 · 1053 阅读 · 0 评论 -
性能测试总结之内存泄露和内存溢出
<br />刚刚做完了一个项目的性能测试,“有幸”也遇到了内存泄露的案例,所以在此和大家分享一下。<br /> 主要从以下几部分来说明,关于内存和内存泄露、溢出的概念,区分内存泄露和内存溢出;内存的区域划分,了解GC回收机制;重点关注如何去监控和发现内存问题;此外分析出问题还要如何解决内存问题。<br /> 下面就开始本篇的内容:<br />第一部分 概念<br /> 众所周知,java中的内存java虚拟机自己去管理的,他不想C++需要自己去释放。笼统地去讲,java的内存分配分为两个部分,一个是数转载 2010-09-25 20:37:00 · 822 阅读 · 0 评论 -
JSON与XML的区别与联系
◆可读性 JSON(Java Object Notation) 和XML的可读性可谓不相上下,一边是建议的语法,一边是规范的标签形式,很难分出胜负。 ◆可扩展性 XML天生有很好的扩展性,JSON当然也有,没有什么是XML能扩展,JSON不能的。 ◆编码难度 XML有丰富的编码工具,比如Dom4j、JDom等,JSON也有json.org提供的工具,但是JSON的编码明显比XML容易许多,即使不借助工具也能写出JSON的代码,可是要写好XML就不太容易了。原创 2010-09-22 10:54:00 · 1233 阅读 · 0 评论 -
最长回文子串
<br />import java.util.ArrayList;import java.util.Iterator;import java.util.List;/** * 基本思路:将原始串翻转,然后计算这两个串的最长公共子串即为最大的回文数 * * @author qibaoyuan * */public class LongestPalindrome { /** * @param args */ public static void原创 2010-09-21 20:56:00 · 721 阅读 · 0 评论 -
不用比较运算符,判断int型的a,b两数的大小的答案
/** * 不用比较运算符,判断int型的a,b两数的大小. * * @author JAVA世纪网(java2000.net, laozizhu.com) */ public class Test { public static void main(String[] args) { int a = 1; int b = 2; String[] buf = { "a=>b", "a >> 31;原创 2010-09-17 22:11:00 · 922 阅读 · 0 评论 -
JVM装载class过程
<br />1.所谓装载就是寻找一个类或是一个接口的二进制形式并用该二进制形式来构造代表这个类或是这个接口的class对象的过程。分为装载、链接和初始化。装载是查找和导入类或接口的二进制数据;链接分为校验、准备、解析。校验检查导入类或接口的二进制数据的正确性;准备给类的静态变量分配并初始化存储空间;解析将符号引用转成直接引用。初始化为类变量赋予程序员想要的初始值。 <br />2.classloader的方法:<br /> getParent() 返回该类加载器的父类加载器。 loadClass(原创 2010-09-05 22:44:00 · 777 阅读 · 0 评论 -
java的反射与内省机制的实现
<br />java的反射机制的实现<br /><br />很多朋友在深入的接触JAVA语言后就会发现这样两个词:反射(Reflection)和内省(Intro<br />spector),经常搞不清楚这到底是怎么回事,在什么场合下应用以及如何使用?今天把这<br />二者放在一起介绍,因为它们二者是相辅相成的。<br /><br />反射<br /><br /><br />相对而言,反射比内省更容易理解一点。用一句比较白的话来概括,反射就是让你可以通<br />过名称来得到对象(类,属性,方法)的技术。例原创 2010-09-18 18:24:00 · 1578 阅读 · 1 评论 -
基于Java技术的大型网站架构方案
Web层主体架构可以基于 Struts 1.X/2.X,当然有很多更好的控制层框架供选择,以快速敏捷为准则吧。抽象出核心库封装 控制器和中间层 的操作。在大规模集群环境下,session复制会引起严重的性能问题。考虑用 集群缓存 + cookie验证 代替session实现权限控制吧。Cache层配置 Memcache 组成集群缓存对 Memcache 客户端进行封装Memcached 节点组成池,调用示意:opList (BizName, 策略 ...)中间层<br />“中间层”可以理解为基于应转载 2010-09-14 20:39:00 · 1150 阅读 · 0 评论 -
JAVA面试题
<br />基础知识:<br /><br />1.C++或Java中的异常处理机制的简单原理和应用。<br /><br />当JAVA 程序违反了JAVA的语义规则时,JAVA虚拟机就会将发生的错误表示为一个异常。违反语义规则包括2种情况。一种是JAVA类库内置的语义检查。例如数组下标越界,会引发IndexOutOfBoundsException;访问null的对象时会引发NullPointerException。另一种情况就是JAVA允许程序员扩展这种语义检查,程序员可以创建自己的异常转载 2010-09-09 23:09:00 · 638 阅读 · 0 评论 -
JDK、JRE、JVM之间的关系
<br />JDK、JRE、JVM之间的关系<br />如果安装了JDK,会发同你的电脑有两套JRE,<br />一套位于 <JDK安装目录>/jre <br />另外一套位于 C:/Program Files/Java/j2re1.4.1_01 目录下<br />后面这套比前面那套少了Server端的Java虚拟机,不过直接将前面那套的Server端Java虚拟机复制过来就行了。而且在安装JDK可以选择是否安装这个位于 C:/Program Files/Java 目录下的JRE。<转载 2010-09-09 22:32:00 · 637 阅读 · 0 评论 -
Spring,struts,hibernate常见的面试笔试题汇总(2)
<br />1.Struts中Action是线程安全的吗?如果不是,请说出理由.在Struts可以定义静态变量吗?<br />参考答案: <br />Servlet是在多线程环境下的。即可能有多个请求发给一个servelt实例,每个请求是一个线程。 <br />struts下的action也类似,同样在多线程环境下。可以参考struts user guide: http://struts.apache.org/struts-action/userGuide/building_cont原创 2010-09-27 00:29:00 · 767 阅读 · 0 评论 -
Spring,struts,hibernate常见的面试笔试题汇总(3)
<br />JAVA相关基础知识 <br />1、面向对象的特征有哪些方面 <br />1.抽象: <br />抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面。抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用部分细节。抽象包括两个方面,一是过程抽象,二是数据抽象。 <br />2.继承: <br />继承是一种联结类的层次模型,并且允许和鼓励类的重用,它提供了一种明确表述共性的方法。对象的一个新类可以从现有的类中派生,这个过程称为类继承原创 2010-09-27 00:30:00 · 958 阅读 · 0 评论 -
unread block data
<br /> 我晕,这个错误折腾了三天,一气之下还原了之前的文件,终于没这个异常了。我推测的原因:因为之前有一些in.readInt(),我以为没用,就给删除了,造成解析的时候读指针无法进行正确地移动,返回的数据异常。原创 2011-03-31 01:34:00 · 9133 阅读 · 0 评论 -
MALLET中的序列化
<br />public void write(File f) { try { ObjectOutputStream oos = new ObjectOutputStream( new FileOutputStream(f)); oos.writeObject(this); oos.close(); } catch (IOException e) { System.err.println("Exception writing file " + f +原创 2011-03-31 00:17:00 · 1165 阅读 · 0 评论 -
利用反射机制调用main函数并传递参数
<br />public void testGenMallet() { try { Method methods = Csv2Vectors.class .getMethod("main", String[].class); methods.invoke(null, (Object) new String[] { "--input", "data/train_10000.data", "--output", "web.mallet", "--pres原创 2011-03-29 00:01:00 · 1169 阅读 · 0 评论 -
GNU Trove替换Java中的map
Trove 是一个快速、轻量级 Collection 类的集合。Trove 提供所有标准 java.util Collections 类的更快的版本以及能够直接在原语(primitive)(例如包含 int 键或值的 Map 等)上操作的 Collections 类的版本。评价:几分钟即上手,效率提升明显、内存占用量显著减少。有时间测试一下~~原创 2011-03-25 20:43:00 · 3847 阅读 · 0 评论 -
HtmlParser1.6修改输出Txt
<br />在NodeList中添加成员函数:<br />public StringBuffer getTxt() { StringBuffer ret; NodeList chirdren; Node node; TextNode txtNode; ret = new StringBuffer(); for (int i = 0; i < size; i++) { node = nodeData[i]; // 只提取txt部分 if (node原创 2011-01-05 15:52:00 · 868 阅读 · 0 评论