解决pdf2htmlEX将pdf文件转化为html,出现错误 Internal Error: assembly tables at wrong place.Copying of text from this document is not allowed.
Internal Error: assembly tables at wrong place.
解决方法:
1)这个是由于输出文件太大原因导致的,可以把pdf文件分割成小文件,具体方法可以参考之前发布的博客。
2)通过参数限制转换输出文件的大小,比如一次性只转换多少页,哪些样式和字体可以生成单独的文件。
"pdf2htmlEX --no-drm 1 --split-pages 1 "
+ "--embed-css 1 --embed-javascript 0 --embed-image 0 --embed-font 1 "
+ "--fit-width 700 --bg-format jpg --auto-hint 1 --svg-node-count-limit 1 "
+ "--embed-external-font 0 --dest-dir /home/xueqy/testPdf/1 --page-filename 1-%d.page /home/xueqy/testPdf/1.pdf";
ERR>Error: Copying of text from this document is not allowed.
这个可以通过增加参数解决:--no-drm 1