自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(8)
  • 资源 (8)
  • 问答 (1)
  • 收藏
  • 关注

转载 Apache Tika:通用的内容分析工具

项目介绍Tika是一个内容分析工具,自带全面的parser工具类,能解析基本所有常见格式的文件,得到文件的metadata,content等内容,返回格式化信息。总的来说可以作为一个通用的解析工具。特别对于搜索引擎的数据抓去和处理步骤有重要意义。Tika是一个目的明确,使用简单的apache的开源项目。下图是Tika诞生的一个历史过程。Tika项目之初来源于Nu

2014-04-30 11:52:54 10167

原创 ttribute value is quoted with " which must be escaped when used within the value

今天做项目访问JSP时,报错:Attribute value is quoted with " which must be escaped when used within the value 。相信很多人都遇到过,以下结合本人查资料与亲自实践得到的结论。1):错误常发生的位置 value=""  2):错误产生的原因,是因为tomcat版本升级后(6.0以后),对双引

2014-04-29 13:39:10 2337

转载 JAR打包的误区:第三方包的嵌套打包

今天弄明白一个关于JAVA项目中JAR打包的问题。我们有时可能会把自己的项目做成第三方包给别人使用,但是同时我们自己的项目又引用了其他已有的第三方包,在打包的时候,我们经常可能自作聪明地将自己引用的第三方包全部封装在项目根目录下的某个folder下(如lib/),然后将整个项目打成JAR包,最后得意忘形地告诉使用这个包的开发人员:“你只需要在项目中引用这个包就可以了,其他什么都不需要做!”

2014-04-23 15:30:37 6992

转载 PL/SQL Developer如何连接64位的Oracle图解

由于硬件技术的不断更新,Win7系统逐渐成为主流,而且计算机内存逐渐增大,为了充分的利用内存资源(因为32为系统最多只能用到3G左右的内存),提高系统性能,很多人开始使用Win7(64Bit)的系统。在64位系统上安装64位的Oracle数据库,但是没有对应的64位PL/SQL Developer,此时就不能使用PL/SQL Developer来进行直接连接的,所以要想实现连接还得需要其他途径来完

2014-04-17 17:24:48 1016

原创 Mapreduce求TopK最大值

package suanfa;import java.io.IOException;import java.net.URI;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;im

2014-04-06 20:55:34 3797 2

原创 mapreduce简单的gzip压缩

MapReduce使用简单的gzip格式进行文件的压缩package example;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;

2014-04-02 22:05:59 2983

转载 Hadoop在MapReduce中使用压缩详解

Hadoop对于压缩格式的是透明识别,我们的MapReduce任务的执行是透明的,Hadoop能够自动为我们将压缩的文件解压,而不用我们去关心。AD:51CTO学院:IT精品课程在线看!Hadoop对于压缩文件的支持如果我们压缩的文件有相应压缩格式的扩展名(比如lzo,gz,bzip2等),hadoop就会根据扩展名去选择解码器解压。

2014-04-02 21:32:41 1850

转载 十道海量数据处理面试题与十个方法大总结

海量数据处理:十道面试题与十个海量数据处理方法总结作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。 第一部分、十道海量数据处理面试题1、海量日志数据

2014-04-01 22:26:32 3671 1

Java通过IText导出word和pdf所有jar

Java通过IText导出word和pdf所有jar(包括spring相关jar,是我工程中所有的jar包)

2015-01-16

MLDN——Java Web 开发实战经典源码笔记(基础篇)|

MLDN——Java Web 开发实战经典 源码笔记 (基础篇)

2012-08-06

MLDN魔乐科技JAVA培训_Oracle课堂笔记1-4

MLDN魔乐科技JAVA培训_Oracle课堂笔记1-4

2012-07-14

Java API5.0 中文版 (全)

熟练的运用Java API5.0 中文版 (全) 是每个开发者开发的必选....

2012-07-07

精通MFC程序

精通MFC程序 详细的介绍了MFC第一部分的各种技术

2012-07-04

JAVA_精通swing程序设计

JAVA_精通swing程序设计 更好的掌握java 图形界面的开发

2012-07-02

李兴华javase全部笔记

李兴华javase全部笔记 更好的更容易的掌握java基础的核心技术

2012-07-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除