自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

宁静致远 厚积薄发

凡成大事者,必有一个执著的信念,它犹如黑夜中的一盏明灯,指引着你勇往直前

  • 博客(15)
  • 资源 (3)
  • 收藏
  • 关注

转载 安装Maven

http://www.cnblogs.com/jifeng/p/4658765.html下载安装去maven官网下载最新版。解压到安装目录。配置右键桌面的计算机图标,属性–>高级系统设置–>环境变量,添加M2_HOME的环境变量,然后将该变量加入的PATH中。注意 必须要有JAVA_HOME和个环境变量,不然maven会提示错误。如果想要修改mave

2016-05-14 23:34:47 285

转载 git-ssh 配置和使用

1、设置Git的user name和email:(如果是第一次的话) $ git config --global user.name "humingx" $ git config --global user.email "[email protected]"2、生成密钥 $ ssh-keygen -t rsa -C "[email protected]"连续3个

2016-05-14 20:38:47 323

转载 IntelliJ IDEA 12 + git

以下内容为idea 12 配置git 具体步骤(idea 10测试没成功,可能和GIT版本有关) :1、安装idea12+git。首先确保已正确安装了idea12 和 git 。我的git目前版本号是:Git-1.8.4。2、在idea中配置git插件。点击setting按钮,在左侧现在git,右侧选择git安装路径。到此插件配置完成!IDEA 12 + git" title="Int

2016-05-14 19:35:54 422

原创 策略模式(Strategy)

http://www.cnblogs.com/justinw/archive/2007/02/06/641414.html

2016-05-12 13:35:01 260

原创 idea 将工程项目打包成war

1.File--Project structure ---- Artifacts ----- + -----web Application :Archive ---for ' **:war exploded '  (记住output directory可查看war包)2.Build--- Build  Artifacts ----  ***----- Build

2016-05-11 22:17:03 11729 1

原创 Ubuntu 14.04 安装Tomcat7.0

1.下载Tomcat7         打开Tomcat官网 http://tomcat.apache.org,在左边的导航栏的“Download"中找到Tomcat7.0目录,点击后进入Tomcat7的页面,选择 tar.gz这个文件类型,然后下载。2.解压文件        下载到本地目录(本人存放的目录是/home/xu/Downloads/)后,我们来解压这个文件。打开终端

2016-05-08 16:07:33 13424

原创 ubuntu14.04 下 tomcat7.0.69部署solr4.10.4

首先保证安装了jdk和tomcat1.下载solr-4.10.4,解压到/opt下2. 为 solr 选择一个目录,并使用 SOLR_HOME 环境变量指向这个目录,我这里选择的是 /opt/solr ,因此我的                     SOLR_HOME=/opt/solr. 如果你想选择不同的目录请替换 /opt/solr3.复制 /opt/solr-4.10.4/

2016-05-08 16:04:56 449

原创 根据mimetype取扩展名

TikaConfig config = TikaConfig.getDefaultConfig();        MimeType mimeType = config.getMimeRepository().forName("application/octet-stream");        String extension = mimeType.getExtension(

2016-05-04 16:54:33 963

转载 Tika常见格式文件抽取内容并做预处理

摘要:本文主要针对自然语言处理(NLP)过程中,重要基础部分抽取文本内容的预处理。首先我们要意识到预处理的重要性。在大数据的背景下,越来越多的非结构化半结构化文本。如何从海量文本中抽取我们需要的有价值的知识显得尤为重要。另外文本格式常常不一,诸如:pdf,word,excl,xml,ppt,txt等常见文件类型你或许经过一番周折还是有办法处理的。倘若遇到database,html,邮件,RTF,图

2016-05-04 16:37:08 11619

原创 Tika文本抽取实例

package metadata;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import org.apache.tika.exception.TikaException;import org.apache.tika.metadata.Metadata;import org.apa

2016-05-04 16:12:15 1436 1

原创 TIKA元数据提取

使用Tika提取图片文件的元数据package metadata;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import org.apache.tika.exception.TikaException;import org.apache.tika.metadata.Metadat

2016-05-04 15:50:56 1354

原创 利用POI抽取PPT中的图片并保存在文件中

package parse;import java.io.File; import java.io.FileOutputStream; import org.apache.poi.hslf.HSLFSlideShow; import org.apache.poi.hslf.model.Picture; import org.apache

2016-05-04 11:48:44 2258

转载 Java 利用POI操作PPT

一, 解析PPT文件中的图片import java.io.File; import java.io.FileOutputStream; import org.apache.poi.hslf.HSLFSlideShow; import org.apache.poi.hslf.model.Picture; import org.apache.

2016-05-04 11:47:38 9691 3

原创 使用pdfbox解析pdf文档信息(属性,内容,图片)

package parse;import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Iterator; impo

2016-05-04 11:36:26 1326

原创 利用POI抽取word中的图片并保存在文件中

1.抽取word doc中的图片package parse;import java.io.*;import java.util.*;import org.apache.poi.hwpf.HWPFDocument;import org.apache.poi.hwpf.model.PicturesTable;import org.apache.poi.hwpf.usermodel.Charact

2016-05-04 11:15:27 6961 2

R in action

R in action (中文版)是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了实用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。

2015-11-17

python简明教程

《简明 Python 教程》为 "A Byte of Python" 的唯一指定简体中文译本,版权 © 2005 沈洁元

2014-11-06

ORACLE的基本函数

ORACLE的单行函数和多行函数。供各位参看和下载。

2012-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除