1.1ppt转html
1.1.1ppt转pdf
通过libreoffice工具转换成pdf
这个在windows实现 下载好就行 跟平常的软件一个用法
图片没上传上去抱歉、、
打开
保存到你要保存的目录
1.1.2pdf转html
参见github
1
|
https:
//github
.com
/coolwanglu/pdf2htmlEX/wiki/Download
|
从Docker容器运行是将pdf文件转换为html的最简单的方法,您不需要知道如何编译和安装pdf2htmlEX。
因为pdf2htmlEX 安装太麻烦了依赖太多
1.1.2.1 安装docker
系统centos6.8
1
2
|
yum
install
-y docker-io
/etc/init
.d
/docker
start
|
1.1.2.2 如何使用这个docker容器把pdf文件转换成html
假设你有一个PDF文件/ pdf / test.pdf,只需运行
1
|
docker run -ti --
rm
-
v
~
/pdf
:
/pdf
bwits
/pdf2htmlexpdf2htmlEX
--zoom 1.3
test
.pdf
|
将test.html在~/pdf目录中生成一个HTML文件。
首次执行会从仓库拉一个镜像下来等待时间较长
1
2
3
|
[root@lanyezi ~]
# docker images
REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE
bwits
/pdf2htmlex
latest bacf7f15f6e6 23 monthsago 245.6 MB
|
1.1.2.3 运行docker容器作为本地命令
设置一个软连接。。docker运行容器然后执行对应的命令
1
2
3
|
alias
pdf2htmlEX=
'docker run -ti --rm -v `pwd`:/pdfbwits/pdf2htmlex pdf2htmlEX'
pdf2htmlEX -h
pdf2htmlEX --zoom 1.3
test
.pdf
|
有关如何安装docker的详细信息,请参阅https://docs.docker.com/installation/
有关如何运行pdf2htmlEX的详细信息,请阅读维基
1
|
https:
//github
.com
/coolwanglu/pdf2htmlEX/wiki/Quick-Start
|
1.1.3关于如何运行pdf2htmlEX
1.1.3.1 第一件事先
强烈建议您安装ttfautohint并随时添加--external-hint-tool=ttfautohint以下每个配方。此工具可以增强Windows上所有浏览器的字体渲染。
仔细检查您是否poppler-data安装了CJK字符。
仔细检查你已经运行sudo make install,或者pdf2htmlEX可能无法正确执行
最简单的情况
假设你有一个PDF文件pdf/test.pdf,只需运行
pdf2htmlEX命令是上文通过docker做的软连接容器
1
|
pdf2htmlEX --zoom 1.3 pdf
/test
.pdf
|
将test.html在当前目录中生成一个HTML文件。
1.1.3.2 高级
1
|
pdf2htmlEX -f 3 -l 5 --fit-width 1024 --
bg
-formatjpg pdf
/test
.pdf
|
将仅转换第3,4页和第页,并将页宽调整为1024像素。背景图像将以JPEG格式生成。
1.1.3.3 对于发布商
1
|
pdf2htmlEX --embed cfijo --dest-
dir
outpdf
/test
.pdf
|
将test.html在out目录中产生一个和附带的文件,以这种方式将所有资源(字体,图像,CSS和JavaScript)存储在分离的文件中,以便查看器可以更好地利用浏览器缓存。
1.1.3.4 适用于高级发布商
1
|
pdf2htmlEX --embed cfijo --
split
-pages 1 --dest-dirout --page-filename
test
-%d.page pdf
/test
.pdf
|
将执行类似的操作,但每个单独的页面都存储在一个单独的文件中。命令行中指定的文件名称等test-0.page,test-1.page依此类推。仍然有一个test.html通过ajax动态加载页面。以这种方式,发布商被完全控制,谁可以按照他们喜欢的方式组织页面,例如实现延迟页面加载。
1.1.3.5 终极之手
1
|
pdf2htmlEX --fallback 1 pdf
/test
.pdf
|
也会产生一个单一的test.html,然而,它包括图像和隐藏的文本。这种模式提供最大的精度和兼容性,代价是更大的文件大小。仅当pdf2htmlEX无法正确处理您的文件时,才能使用此模式。
自发研究
1
|
pdf2htmlEX --fallback 1 --fit-width 1024 --fit-height 720 --
bg
-
format
jpg
test
.pdf
|
1.1.3.6 更多
只要记住man pdf2htmlEX,pdf2htmlEX --help永远是你最好的朋友。