实现一个具有百度文库文档转换功能的工具类

    转载请注明来自“柳大的CSDN博客”,原文地址:http://blog.csdn.net/poechant/article/details/7238056


    用过百度文库、豆丁的朋友,都知道,我们只要将文档上传到这些网站上,就可以实现分享。无论你上传的是pdfppt,还是doctxtpptx文件,都会在网页上显示给用户看。从技术上简单地说,可以分成三步:


1)将格式为x的文档文件上传到服务器;

2)在服务器上完成文档的相关处理;

3)将处理后的结果展示在网页上。


其中最关键的一步就是(2)。做技术的人都可以很容易地看出来,这类用web应用是用flash显示出来的。那么,一个文档文件,是如何转换为swf文件的呢?本文就将为你介绍,如何避免再造车轮的冗余行为发生,而借助高效的工具将docpptpdf等文档文件转换为swf格式。比如百度文库接收用户上传的文件后,显示在网页上时是其转换成的SWF格式文件。这样就很适合Web应用了。


一、JODConverter


    首先利用JODConverterdocppttxtdocx等文件转换为pdf文件。然后用SwfToolspdf文件转换为swf文件。JODConverter是一个名叫Java OpenDocument Converter的基于LGPL协议的软件,用于实现不同的office格式之间的转换,这些office格式包括Microsoft OfficeOpenOfficeJODConverter的项目主页是http://www.artofsolving.com/opensource/jodconverter,可以查看更多的信息。可以通过SourceForge.net下载。


    首先要安装OpenOfficeJODConverter的功能,基本就是实现了OpenOffice中的另存为的功能。个版本的OpenOffice的下载地址为:


Language 

The names do not refer to countries.

 

Windows 

Intel 

MSI

Linux 

Intel 

RPM

Linux 

Intel 

DEB

Linux 

x86-64

RPM

Linux 

x86-64

DEB

Mac OS

Intel 

DMG

Mac OS

PPC ¹

DMG

Solaris 

Intel 

PKG

Solaris 

Sparc 

PKG

Arabic

عربي

Download

Download

Download

Download

Download

Download


Download

Download

Basque

Euskara

Download

Download

Download

Download

Download

Download

Download

Download

Download

Bengali

বাংলা

Download

Download

Download

Download

Download

Download

Download

Download

Download

Bulgarian

български език

Download

Download

Download

Download

Download

Download


Download

Download

Catalan

Català

Download

Download

Download

Download

Download

Download

Download

Download

Download

Catalan (Valencian)

Català (Valencià)

Download

Download

Download

Download

Download

Download

not available

Download

Download

Chinese (simplified)

简体中文

Download

Download

Download

Download

Download

Download


Download

Download

Chinese (traditional)

正體中文

Download

Download

Download

Download

Download

Download


Download

Download

Czech

čeština

Download

Download

Download

Download

Download

Download


Download

Download

Danish

Dansk

Download

Download

Download

Download

Download

Download

3.2.1

Download

Download

Dutch

Nederlands

Download

Download

Download

Download

Download

Download

Download

Download

Download

English (British)

English (British)

Download

Download

Download

Download

Download

Download


Download

Download

English (US)

English (US)

Download

Download

Download

Download

Download

Download

3.2.1

Download

Download

Estonian

Eesti keel

Download

Download

Download

Download

Download

Download


Download

Download

Finnish

Suomi

Download


Download



3.2.1

Download

Download

Download

French

Français

Download

Download

Download

Download

Download

Download

Download

Download

Download

Galician

Galego

Download

Download

Download

Download

Download

Download


Download

Download

German

Deutsch

Download

3.2.1

Download

3.2.1

3.2.1

Download

3.2.0

Download

Download

Greek

Ελληνικά

Download

Download

Download

Download

Download

Download


Download

Download

Hebrew

עִבְרִית

Download

Download

Download

Download

Download

Download

Download

Download

Download

Hungarian

Magyar

Download

Download

Download

Download

Download

Download


Download

Download

Irish

Gaeilge

Download

Download

Download

Download

Download

Download


Download

Download

Italian

Italiano

Download

Download

Download

Download

Download

Download




Language 

The names do not refer to countries.

 

Windows 

Intel 

MSI

Linux 

Intel 

RPM

Linux 

Intel 

DEB

Linux 

x86-64

RPM

Linux 

x86-64

DEB

Mac OS

Intel 

DMG

Mac OS

PPC ¹

DMG

Solaris 

Intel 

PKG

Solaris 

Sparc 

PKG

Japanese

日本語

Download

Download

Download

Download

Download

Download

Download

Download

Download

Khmer

ភាសាខ្មែរ

Download

Download

Download

Download

Download

Download

3.2.1

Download

Download

Korean

한국어

Download

Download

Download



Download


Download

Download

Kurdish

Kurdî

3.2.1









Lithuanian

Lietuvių

Download

Download

Download

Download

Download

Download

3.0.1

Download

Download

Macedonian

Македонски

Download

Download

Download

Download

Download

Download

3.0.0

Download

Download

Mongolian

Монгол

3.0.0

3.0.0

3.0.0







Norwegian (Bokmål)

Norsk (Bokmål)

Download

Download

Download

Download

Download

Download


Download

Download

Norwegian (Nynorsk)

Norsk (Nynorsk)

3.2.0

3.2.0

3.2.0

3.2.0

3.2.0





Oromo

ኦሮሚኛ

Download

Download

Download

Download

Download

Download


Download

Download

Polish

Polski

Download

Download

Download

Download

Download

Download


Download

Download

Portuguese (Brazilian)

Português (do Brasil)

Download

Download

Download

Download

Download

Download


Download

Download

Portuguese (European)

Português (Europeu)

Download

Download

Download

3.2.1

3.2.1

Download


Download

Download

Russian

Русский

Download

Download

Download

Download

Download

Download


Download

Download

Serbian (Cyrillic)

Cрпски (ћирилицом)

Download

Download

Download

Download

Download

Download


Download

Download

Serbian (Latin)

Srpski (latinicom)

Download

Download

Download

Download

Download

Download


Download

Download

Slovenian

Slovenski jezik

Download

Download

Download

Download

Download

Download

Download

Download

Download

Spanish

Español

Download

Download

Download

Download

Download

Download

3.0.0

Download

Download

Swedish

Svenska

Download

Download

Download

Download

Download

Download

3.1.0

Download

Download

Turkish

Türkçe

Download

Download

Download

Download

Download

Download


Download

Download

Vietnamese

Tiếng Việt

Download

Download

Download

Download

Download

Download


Download

Download


    安装完OpenOffice后,要记住你的OfficeHome。不同平台的OfficeHome是不同的。比如你将OpenOffice安装到Windows“D:\Program Files\OpenOffice.org 3”,那么这就是你在Windows上的OfficeHome。如果你是Linux用户,你可能会将OpenOffice安装到“/opt/openoffice.org3”,这就是你的OfficeHome。如果你是Mac用户,在Mac系统的自动安装后,你需要知道你的OfficeHome“/Application/OpenOffice.org.app/Contents”

   一定要知道你的OfficeHome,否则JODConverter是没法工作的。然后下载JODConverter API,下载页:http://sourceforge.net/projects/jodconverter/


二、SwfTools


    然后利用SwfTools就中间生成的pdf文件,转换为swf文件。SwfTools是将各种不同格式的文件转换为Adobe Flashswf格式文件的软件,可以运行在LinuxMacFreeBSDUnix-like系统以及Windows系统上。它可以实现pdfaviwavpngjpeggif等格式向swf格式的转换。该项目主页是http://www.swftools.org/,在http://www.swftools.org/download.htmlx下载


1WindowsLinuxMac用户可以忽略)

1)下载安装swftools

下载地址:swftools-0.9.1.exe

安装目录:D:\Program Files\swftools


2)将不同格式的文件转换为SWF

使用安装目录下的转换命令:

  1. avi2swf inputFile -o outputFile  
  2. font2swf inputFile -o outputFile  
  3. gif2swf inputFile -o outputFile  
  4. jpeg2swf inputFile -o outputFile  
  5. pdf2swf inputFile -o outputFile  
  6. png2swf inputFile -o outputFile  
  7. wav2swf inputFile -o outputFile  



2LinuxWindowsMac用户可以忽略)

1)安装依赖库

  1. sudo apt-get install libpng12-dev  
  2. sudo apt-get install libjpeg62-dev  
  3. sudo apt-get install libgif-dev  
  4. sudo apt-get install libfreetype6-dev  

2)安装swftools

  1. wget http://www.swftools.org/swftools-0.9.1.tar.gz  
  2. tar zxvf swftools-0.9.1.tar.gz  
  3. cd swftools-0.9.1  
  4. ./configure  
  5. make  
  6. sudo make install  

3)将其他文件格式转换为SWF

参考Windows平台上的SwfTools使用。


3MacWindowsLinux用户可以忽略)

1)安装swftools

最简单的方式,是用macportfink等来安装。macport的命令为:

  1. sudo port install swftools  

MacPort安装SwfTools,不需要考虑其依赖库,MacPort会帮助你安装好。MacPort的安装,请参考《Mac OS X Lion安装MacPorts(让你在MacShell下更加游刃有余)》一文。


2)将其他文件格式转换为SWF

参考Windows平台上的SwfTools使用。


三、Java实例实现各office文件格式向swf的转换


创建一个实现类型转换的工具类,命名为FileConverterUtil,如下:


  1. public class FileConverterUtil {  
  2.     public static String fileToSwf(String inputFilePath) {  
  3.         return pdfToSwf(fileToPdf(inputFilePath));  
  4.     }  
  5.     private static String fileToPdf(String inputFilePath) {  
  6.         //...  
  7.     }  
  8.     private static String pdfToSwf(String inputFilePath) {  
  9.         //...  
  10.     }  
  11. }  


然后分别实现fileToPdfpdfToSwffileToPdf中使用到JODConverterAPI,如下:


  1. import org.artofsolving.jodconverter.office.DefaultOfficeManagerConfiguration;  
  2. import org.artofsolving.jodconverter.office.OfficeManager;  
  3. import org.artofsolving.jodconverter.OfficeDocumentConverter;  
  4. import java.io.File;  
  5.   
  6. private static String fileToPdf(String inputFilePath) {  
  7.     DefaultOfficeManagerConfiguration config = new DefaultOfficeManagerConfiguration();  
  8.           
  9.     String officeHome = getOfficeHome();  
  10.     config.setOfficeHome(officeHome);  
  11.       
  12.     OfficeManager officeManager = config.buildOfficeManager();  
  13.     officeManager.start();  
  14.   
  15.     OfficeDocumentConverter converter = new OfficeDocumentConverter(officeManager);  
  16.     String outputFilePath = getOutputFilePath(inputFilePath);  
  17.     converter.convert(new File(inputFilePath), new File(outputFilePath));  
  18.   
  19.     officeManager.stop();  
  20. }  

其中getOfficeHome()可以根据你使用该工具类的平台增加程序的可移植性。fileToPdf可以实现各种office文件到pdf文件的转换。


  1. private static String getOfficeHome(String inputFilePath) {  
  2.     String osName = System.getProperty("os.name");  
  3.     if (Pattern.matches("Linux.*", osName) {  
  4.         return "/opt/openoffice.org3";  
  5.     } else if (Pattern.matches("Windows.*", osName) {  
  6.         return "D:\\Applications\\OpenOffice.org 3";  
  7.     } else if (Pattern.matches("Mac.*", osName) {  
  8.         return "/Application/OpenOffice.org.app/Contents";  
  9.     }  
  10.     return null;  
  11. }  


提供统一的转换文件命名规则,可以提供如下方法,具体实现看你应用场景的方便性了。


  1. private static String getOutputFilePath(String inputFilePath) {  
  2.     // Initialized by yourself.  
  3. }  

然后利用SwfTools实现PdfToSwf方法。


  1. private static String pdfToSwf(String inputFilePath) {  
  2.     try {  
  3.         String outputFilePath = getOutputFilePath(inputFilePath);  
  4.         String[] command = new String[4];  
  5.         command[0] = getSwftoolsHome();  
  6.         command[1] = inputFilePath;  
  7.         command[2] = "-o";  
  8.         command[3] = outputFilePath;  
  9.         Process process = Runtime.getRuntime().exec(command);  
  10.         process.waitFor();  
  11.         return outputFilePath;  
  12.     } catch (Exception e) {  
  13.         // initialized by yourself.  
  14.     }  
  15. }  


其中getSwftoolsHome方法就是获取你的SwfTools所在目录,依据不同平台,你可以如下实现该方法:


  1. private static String getSwftoolsHome() {  
  2.     String osName = System.getProperty("os.name");  
  3.     if (Pattern.matches("Linux.*", osName) {  
  4.         return "/usr/local/bin";  
  5.     } else if (Pattern.matches("Windows.*", osName) {  
  6.         return "D:\\Program Files\\SwfTools";  
  7.     } else if (Pattern.matches("Mac.*", osName) {  
  8.         return "/usr/local/bin";  
  9.     }  
  10.     return null;  
  11. }  

这样类似于百度文库、豆丁网的文档转换工具的核心功能就基本实现了。Enjoy It


转载请注明来自“柳大的CSDN博客”,原文地址:http://blog.csdn.net/poechant/article/details/7238056

阅读更多
个人分类: 环境搭建
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭