实验环境:eclipse3.1
下载:xpdf-3.02pl2-win32.zip,xpdf-chinese-simplified.tar.gz
下载地址:http://www.foolabs.com/xpdf/
.解压pdf-3.02pl2-win32.zip到c盘,同时改名为xpdf
.解压xpdf-chinese-simplified.tar.gz到c:/xpdf下,同时改名为chinese
.在c:/xpdf下创建文件xpdfrc (在pdftotext.exe的同级目录下)
cidToUnicode Adobe-GB1 c://xpdf//chinese//Adobe-GB1.cidToUnicode
unicodeMap ISO-2022-CN c://xpdf//chinese//ISO-2022-CN.unicodeMap
unicodeMap EUC-CN c://xpdf//chinese//EUC-CN.unicodeMap
unicodeMap GBK c://xpdf//chinese//GBK.unicodeMap
cMapDir Adobe-GB1 c://xpdf//chinese//CMap
toUnicodeDir c://xxpdf//chinese//CMap
fontDir C://WINDOWS//Fonts
displayCIDFontTT Adobe-GB1 C://WINDOWS//Fonts//simhei.TTF
textEOL CR+LF
在设置路径的时候可以根据实际的环境进行设置
.在程序可以调用
Process p = Runtime.getRuntime().exec(cmd);
其中cmd是参照pdftotext.txt文件的说明进行设置
下载:xpdf-3.02pl2-win32.zip,xpdf-chinese-simplified.tar.gz
下载地址:http://www.foolabs.com/xpdf/
.解压pdf-3.02pl2-win32.zip到c盘,同时改名为xpdf
.解压xpdf-chinese-simplified.tar.gz到c:/xpdf下,同时改名为chinese
.在c:/xpdf下创建文件xpdfrc (在pdftotext.exe的同级目录下)
cidToUnicode Adobe-GB1 c://xpdf//chinese//Adobe-GB1.cidToUnicode
unicodeMap ISO-2022-CN c://xpdf//chinese//ISO-2022-CN.unicodeMap
unicodeMap EUC-CN c://xpdf//chinese//EUC-CN.unicodeMap
unicodeMap GBK c://xpdf//chinese//GBK.unicodeMap
cMapDir Adobe-GB1 c://xpdf//chinese//CMap
toUnicodeDir c://xxpdf//chinese//CMap
fontDir C://WINDOWS//Fonts
displayCIDFontTT Adobe-GB1 C://WINDOWS//Fonts//simhei.TTF
textEOL CR+LF
在设置路径的时候可以根据实际的环境进行设置
.在程序可以调用
Process p = Runtime.getRuntime().exec(cmd);
其中cmd是参照pdftotext.txt文件的说明进行设置