如何在hdfs上将文件下载_如何在Linux上将HTML文件转换为文本

如何在hdfs上将文件下载

How to convert HTML file to a text on Linux?

如何在Linux上将HTML文件转换为文本?

You can use html2text (can be installed on Fedora by yum install html2text):

您可以使用html2text (可以通过yum install html2text安装在Fedora上):

$ html2text ${html_file}

${html_file} is the html file to be converted. The converted text will be printed to the STDOUT. You can redirect it to a file if it is needed.

$ {html_file}是要转换的html文件。 转换后的文本将被打印到STDOUT上 。 您可以根据需要将其重定向到文件。

Answered by anonymous.
匿名回答。


Adding -style pretty can make html2text prints additional spaces/lines to make the text look more prettier.

添加- style pretty可以使html2text打印更多的空格/行,以使文本看起来更漂亮。



The -width 100 option may help for pages that are rendered strangely.

-width 100选项可能有助于呈现奇怪的页面。

翻译自: https://www.systutorials.com/how-to-convert-html-file-to-text-on-linux/

如何在hdfs上将文件下载

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值