POI等 操作Word、Excel、Pdf
jazwoo
这个作者很懒,什么都没留下…
展开
-
使用Jacob来处理Word文档
Word或Excel程序是以一种COM组件形式存在的。如果能够在Java中调用Word的COM组件,就能使用它的方法来获取Word文档中的文本信息。目前网上有许多提供这样的工具。7.4.1 Jacob的下载Jacob 是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库,并通过JNI的方式实现了在Java平台上对CO转载 2012-04-11 23:20:27 · 893 阅读 · 0 评论 -
(8)POI定位word图片
图片位置。我解决图片位置是首先读出word中的图片放到list中去,然后采用文本方式读word,读出来替换(int)1 + ""。插入图片链接。public static void main(String[] args) {try {String path = "image.doc";FileInputStream in = new FileInputStream(ne原创 2012-04-14 16:16:54 · 1908 阅读 · 1 评论 -
(7)POI 读word 图片
public static void main(String args[]) {try {String path = “D:/测试word.DOC”;FileInputStream in = new FileInputStream(new File(path));HWPFDocument doc = new HWPFDocument(in);PicturesTable pi原创 2012-04-14 16:11:05 · 871 阅读 · 0 评论 -
POI实现对word读取和修改操作
java编程要实现对word的操作没有vb那种编程语言来得容易,得借助一些开源组件,其中就包括jacob、poi等, 而poi应用得最为广泛,对word2003和2007的读和写word操作都十分方便。它是Apache组织的一个项目,早在2001年就已经发布了第 一个版本,可以说是apache组织的一个老牌项目,到现在已经走过了10年光辉历程,目前最新版本是3.8的beta版本。下面就以该版本转载 2012-04-14 16:06:35 · 2560 阅读 · 1 评论 -
(6) POI定位word表格
这里可以读word目录,word表格,word图片。当然不只是读出来,而是将word转成html。(我们的还要将word内容进行分页显示)我在前两篇里已经写到如何读word的表格,word的图片。这里边涉及两个定位问题,一是表格位置,另一个是图片位置。图片位置。我解决图片位置是首先读出word中的图片放到list中去,然后采用文本方式读word,读出来替换(int)1 +原创 2012-04-14 15:58:39 · 3260 阅读 · 0 评论 -
(5) POI操作word,能控制字体和颜色
public static void main(String[] args){try{FileInputStream in = new FileInputStream(“C://blank.doc”);HWPFDocument doc = new HWPFDocument(in);Range range = doc.getRange();CharacterPropertie原创 2012-04-12 18:26:20 · 4071 阅读 · 0 评论 -
(3) POI读取word表格内容
package PoiTest;import java.io.FileInputStream;import org.apache.poi.hwpf.HWPFDocument;import org.apache.poi.hwpf.usermodel.Paragraph;import org.apache.poi.hwpf.usermodel.Range;import or原创 2012-04-12 18:24:22 · 1923 阅读 · 1 评论 -
(1) POI提取word文档
通过下面的两种方法可以从文档里读取所有字符性的内容(忽略字符的属性)。 通过输出流来写到文本文件中。 public static void getWordContent(String fileName) throws Exception{ FileInputStream in = new FileInputStream(new File(fileName)); Word原创 2012-04-12 18:22:55 · 1216 阅读 · 0 评论 -
简介POI处理word中的:文本、图、表和宏
WORD文本组成:文本、图、表和宏。HWPF主要关注文本。 1. File Information Block (FIB): 文件信息块 2. 文本提取 text extraction 基本文本提取 : org.apache.poi.hwpf.extractor.WordExtractor getText() : TEXT getParagraphText()转载 2012-04-11 23:28:24 · 3421 阅读 · 0 评论 -
使用PDFBox处理PDF文档
在本书的前面所介绍的内容中,所处理的都是纯文 本文件。但是事实上,人们用于保存信息的文件并不是纯文本格式。现在比较流行的文件存储格式有Adobe公司的PDF和Microsoft的Word、 Excel等。在处理这些文件的时候,不能简单的从文件读取字符,需要根据他们特殊的格式提取内容。本章就将对比较流行的PDF、Word和Excel格 式的处理工具逐一进行介绍。7.1 使用PDFBox转载 2012-04-11 23:16:58 · 1477 阅读 · 0 评论 -
简介POI处理Excel和Word文件格式
http://poi.apache.org/apidocs/ API 帮助文档一:认识POIApache POI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。最新的3.5版本有很多改进,加入了对采用OOXML格式的Office 2007支持,如xlsx、docx、pptx文档。POI主页:poi.apache.org/转载 2012-04-11 23:17:53 · 1299 阅读 · 0 评论 -
(4) POI往Word插入字符串
package lili.com;import java.io.ByteArrayInputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.OutputStream;import org.apache.po原创 2012-04-12 18:25:06 · 2186 阅读 · 0 评论 -
(2) POI 读word表格
第一段Java codetry { FileInputStream in = new FileInputStream("D:\\XBRL.doc");// 载入文档 POIFSFileSystem pfs = new POIFSFileSystem(in); HWPFDocument hwpf = new原创 2012-04-12 18:23:28 · 1254 阅读 · 0 评论 -
POI操作Word中表格 转html的table时解决横跨colspan
在将word按要求转成html时。并且css样式跟文档要一致碰到了表格时,百度了好久,没见到有解决POI读取word中表格转成html的表格解决横跨的自己也尝试了好久,TableRow tr = tb.getRow(i); tr.getRowHeight(); TableCell td = tr.getCell(j);//取得单元格 TableRow原创 2012-07-03 15:49:59 · 3920 阅读 · 5 评论