java
hotsunshine
这个作者很懒,什么都没留下…
展开
-
Java判断文件类型是二进制文件还是文本文件
1.根据后缀名,这个就是简单的字符串匹配,由于存在改名情况,基本无用2.根据文件流中是否存在0x00-0x07这八个字符,如果存在说明是二进制文件,需要读取整个文件去判断,感觉效率太低3.通过javax.activation.MimetypesFileTypeMap这个类来实现,它是通过直接与系统交互来实现的,感觉比上面两个要好[code="java"] void ad...原创 2010-12-13 22:47:32 · 2045 阅读 · 0 评论 -
使用Lucene3和IKAnalyzer对一段文本进行分词
[code="java"]import java.io.IOException;import java.io.StringReader;import java.util.ArrayList;import java.util.List;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.ana...原创 2010-12-23 21:36:40 · 78 阅读 · 0 评论 -
Java获取文件类型Mime Type的各种方法
[b][size=medium]使用 javax.activation.MimetypesFileTypeMap[/size][/b]需要引入activation.jar这个jar包 , 他可以从下面这个网站获得[url]http://java.sun.com/products/javabeans/glasgow/jaf.html[/url].这个MimetypesFileMap类会映射出...原创 2011-01-01 22:50:10 · 1103 阅读 · 0 评论 -
thrift实现java与ruby的交互
thrift在apache中主页[url]http://thrift.apache.org/[/url]Thrift是一个可以提供跨语言开发的框架,它允许你在一个配置文件中定义数据类型和服务接口 ,把这个文件作为输入,编译器产生的代码将要被用来建立RPC客户端和服务端的跨语言的无缝连接。thrift0.5的下载地址[url]http://www.apache.org/dyn/clo...原创 2010-12-09 21:42:00 · 184 阅读 · 0 评论 -
Lucene增量索引的搜索结果重复的问题
Lucene的增量索引没有那么智能,虽然根据文档所言,把下面的第三个参数设为false就是增量索引(true to create the index or overwrite the existing one; false to append to the existing index,注意这个append)。但是我发现,它与true的区别,仅仅在于不去删掉以前所有的索引文件而已,他并不能智能的分...原创 2010-12-11 11:05:31 · 561 阅读 · 0 评论 -
ubuntu1210安装java7以及hadoop,hive,pig
一、安装java[code="java"]$ mkdir -p /usr/local/java$ cd /usr/local/java[/code]# 压缩包复制过去[code="java"]$ sudo -s cp -r /mnt/shared_2/jdk-7u11-linux-i586.tar.gz ./$ sudo -s cp -r /mnt/shared_2/j...原创 2013-01-30 14:34:28 · 77 阅读 · 0 评论 -
Java中的long类型的秒数转成字符串
Java中的long类型的秒数转成字符串[code="java"] // published是时间lang值 比如:1419323634391 public String getPublishedStringLong() { String pattern = "yyyy-MM-dd HH:mm:ss"; SimpleDateForma...原创 2014-12-26 17:46:51 · 1096 阅读 · 0 评论