PDF浏览器(Xpdf)中文解决方案

原创 2006年06月10日 00:19:00
由于学习的需要,发现debian上的pdf浏览工具对中文的支持很差,在网上找了找,发现一种解决方案,不过很大虾们却没有说得很详细,所以在前人的基础上,我丰富了下,大家共享一起学习学习,如有什么要说的,给我留言吧!^_^
方案如下:
1、我的OS:debian 3.1
2、安装xpdf:apt-get install xpdf
3、access http://www.foolabs.com/xpdf
4、download xpdf-chinese-simplified.tar.gz
5、解压:tar zxvf xpdf-*.tar.gz
6、找到你的XPDF安装的目录,默认是在:/usr/share/xpdf
7、在xpdf的安装目录下建一个名为chinese-simplified的文件夹
8、将我们在 5 中所解压的xpdf-chinese-simplified中的所有文件copy至 7 的文件夹下
9、接下来我们开始修改xpdf的配置文件。
10、在debian中xpdf的配置文件在/etc/xpdf目录下,名为xpdfrc
11、备份xpdfrc,将8的chinese-simplified文件夹中的add-to-xpdfrc文件的内容添加至xpdf的配置文件中.(这里可能要修改下路径,add-to-xpdfrc中的路径是/usr/local/share/xpdf,改成/usr/share/xpdf)
12、这样基本上是可以了。

为什么说是基本上可以了呢?
原因是:
To display PDF files that refer to non-embedded Chinese fonts, you
will need to install a Chinese font.  Free TrueType fonts are
available:

    http://ftp.gnu.org/gnu/non-gnu/chinese-fonts-truetype/gkai00mp.ttf.gz
    http://ftp.gnu.org/gnu/non-gnu/chinese-fonts-truetype/gbsn00lp.ttf.gz

After installing a Chinese font, add an appropriate "displayCIDFontTT"
line to your xpdfrc file (see the sample in "add-to-xpdfrc").

1、我们先从上面的链接中下载这两个字体文件
2、gunzip *.gz解压
3、将它们copy到/usr/share/xpdf/chinese-simplified中。
4、把“displayCIDFontTT    Adobe-GB1    /usr/share/xpdf/chinese-simplified/gkai00mp.ttf”加入到/etc/xpdf/xpdfrc中。
5、这样我想应该全部解决了吧!呵呵呵,开始阅读我们的PDF文档吧。

PDF转换解析工具—XPDF

String[] cmd = getCmd(new File(targetfile), isLayout); Runtime.getRuntime().exec(cmd); 最近...
  • splendid_java
  • splendid_java
  • 2016年09月01日 18:29
  • 2102

Xpdf-Linux安装教程

Xpdf-Linux安装教程 环境:CentOS5.X 插件:完整软件安装系统 一、下载Xpdf-linux 网址:http://www.foolabs.com/xpd...
  • u011334621
  • u011334621
  • 2015年03月04日 14:22
  • 1384

(10)XPDF读取文本

XPDF是一个软件,我们可以通过XPDF抽取PDF中的文本。然而要利用XPDF提取中文文本,需要对其进行一些修改和配置。 1、下载XPDF,下载地址: ftp://ftp.foolabs.com/p...
  • Fighting_No1
  • Fighting_No1
  • 2016年04月01日 18:57
  • 885

php关于pdf的读取(xpdf)

php读取pdf主要采用了xpdf+shell_exec这个模式, 通过xpdf把pdf解析然后用正则表达式获取你想要的东西。 安装方式: [root@localhost ~]# mkdir -p ...
  • u014017080
  • u014017080
  • 2016年11月15日 10:21
  • 1091

使用xpdf解析中文PDF详细过程

下载xpdf和xpdf-chinese-simplified.tar.gz ,然后将xpdf-chinese-simplified.tar.gz解压到xpdf所在的目录形成一个子目录 http:...
  • hong0220
  • hong0220
  • 2015年06月15日 14:47
  • 4848

lucene-用xpdf来处理中文pdf文档

xpdf只是一个软件,通过java采用命令行调用,并获取输出结果,如此来说使用简单,但是相当受限,如:无法跨平台,无法处理特定格式(表格等),无法处理图片和其他附件。这种调用必定限制了它的灵活性。 ...
  • pf1234321
  • pf1234321
  • 2013年05月03日 22:13
  • 753

Xpdf使用说明之pdftotext

pdftotext 官方介绍
  • github_33934628
  • github_33934628
  • 2016年03月06日 21:11
  • 1355

用xpdf和pdfbox来处理中文PDF文档及其比较

转自:http://emily2ly.iteye.com/blog/743552 我在以前的项目中使用的是pdfbox,在读取中文文档时可以读出大部分的文字,但是在数字、分页等地方还是不可避...
  • xl19900502
  • xl19900502
  • 2015年11月16日 17:25
  • 1763

浏览器实现PDF预览

1、使用jquery.media.js预览PDF  charset="utf-8" /> 01使用jquery.media插件进行PDF预览  type="text/javascript"...
  • chongxin1
  • chongxin1
  • 2017年08月07日 21:51
  • 747

pdflib输出中文pdf

pdflib版本: PDFlib-Lite-7.0.5p3
  • zhuyonghao123
  • zhuyonghao123
  • 2014年06月23日 14:39
  • 4386
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:PDF浏览器(Xpdf)中文解决方案
举报原因:
原因补充:

(最多只允许输入30个字)