linux命令行怎么编辑文本,如何使用Linux中的命令行将PDF文件转换为可编辑文本 | MOS86...

71b5c0fc49b11409877cc5972a473247.gif

有几种原因,您可能希望将PDF文件转换为可编辑文本。也许你需要修改一个旧的文档,你所有的是它的PDF版本。在Windows中转换PDF文件很容易,但是如果您使用Linux则需要

相关文章图片1tupian将PDF文件转换为Word文档和其他格式

不用担心我们将向您展示如何使用名为pdftotext的命令行工具轻松将PDF文件转换为可编辑文本,这是“poppler-utils”软件包的一部分。此工具可能已安装。要检查系统上是否安装了pdftotext,请按“Ctrl Alt T”打开终端窗口。在提示符下键入以下命令,然后按“Enter”。

dpkg -s poppler-utils

NOTE:当我们说在这篇文章中输入一些东西,并且在文本上有引号时,不要输入引号,除非另有说明。

71b5c0fc49b11409877cc5972a473247.gif

如果未安装pdftotext,请在提示符下键入以下命令,然后按“Enter”。

sudo apt-get install poppler-utils

在出现提示时键入密码,然后按“Enter”键。

71b5c0fc49b11409877cc5972a473247.gif

poppler-utils包中有几种工具可用于将PDF转换为不同格式,操作PDF文件以及从文件中提取信息。

71b5c0fc49b11409877cc5972a473247.gif

以下是将PDF文件转换为可编辑文本文件的基本命令。按“Ctrl Alt T”打开终端窗口,在提示符下键入命令,然后按“Enter”。

pdftotext / home / lori / Documents / Sample。pdf / home / lori / Documents / Sample。txt

更改每个文件的路径,以对应于原始PDF文件的位置和名称以及要保存生成的文本文件的位置。此外,更改文件名以符合您的文件名称。

71b5c0fc49b11409877cc5972a473247.gif

文本文件被创建,可以像在Linux中打开任何其他文本文件一样打开。

71b5c0fc49b11409877cc5972a473247.gif

转换后的文字可能在您不想要的地方有换行符。在PDF文件中的每一行文本后插入换行符。

71b5c0fc49b11409877cc5972a473247.gif

您可以保留文档的布局(页眉,页脚,分页等))使用“-layout”标志从转换后的文本文件中的原始PDF文件中移除。

pdftotext -layout / home / lori / Documents / Sample。pdf / home / lori / Documents / Sample。txt

71b5c0fc49b11409877cc5972a473247.gif

如果要仅转换PDF文件中的一系列页面,请使用“-f”和“-l”(小写“L”)标志来指定要转换的范围中的第一页和最后一页。

pdftotext -f 5 -l 9 / home / lori / Documents / Sample。pdf / home / lori / Documents / Sample。txt

71b5c0fc49b11409877cc5972a473247.gif

要使用所有者密码转换受保护和加密的PDF文件,请使用“-opw”标志(标志中的第一个字符为小写字母“O”,而不是零)。

pdftotext -opwpassword/ home / lori / Documents / Sample。pdf / home / lori / Documents / Sample。txt

将“密码”改为用于保护正在转换的原始PDF文件的密码。确保在“密码”周围有单引号,而不是双引号。

71b5c0fc49b11409877cc5972a473247.gif

如果PDF文件受到用户密码的保护和加密,请使用“-upw”标志而不是“-opw”标志。命令的其余部分是相同的。

71b5c0fc49b11409877cc5972a473247.gif

您还可以指定应用于转换文本的行尾字符的类型。如果您打算在不同的操作系统(如Windows或Mac)上访问该文件,这将非常有用。为此,请使用“-eol”标志(标志中的中间字符是小写字母“O”,而不是零),后跟一个空格和要使用的行尾字符的类型(“ unix“,”dos“或”mac“)。

71b5c0fc49b11409877cc5972a473247.gif

NOTE:如果不为文本文件指定文件名,则pdftotext将自动使用PDF文件名的基础,并添加“。txt“扩展名。例如,“文件”。pdf“将被转换为”文件“。文本”。如果文本文件被指定为“ - ”,则转换的文本将发送到stdout,这意味着该文本显示在“终端”窗口中,不会保存到文件中。

要关闭终端窗口,请单击左上角的“X”按钮。

有关pdftotext命令的更多信息,请在终端窗口的提示符下键入“man page pdftotext”。

."

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值