如何利用前端知识,免费复制百度文库文档中的纯文字信息(不带格式)

目录

 

前言

1.动态加载jq

2.如果是大篇幅的文章,先点击继续阅读,将整篇文章加载出来(重要!!!)再执行下一步

3.使用jq代码将所有文字样式的段落的纯文本提取出来

4.根据自己需要,将复制过来的文本调整好格式即可。


前言

现在的百度文库已经不能像以前一样使用冰点文库等软件来免费下载文档了,而且限制了不可以直接Ctrl+C,Ctrl+V来复制粘贴了。另外我发现连右键都不可以了,那我们还想继续复制的话,能有什么办法呢?于是就有了这篇文章,利用前端知识来复制百度文库中整一篇doc文档的纯文字。我一开始是尝试直接用jq的写法,不过可以试出来,百度文库的页面是没有加载jq的,于是我需要做的就是先动态加载jq,然后找出所有段落的通用样式,通过jq去获取这个样式的文本,就可以得到我们想要的结果了。下面就让我们一步步来:

1.动态加载jq

按F12进入开发者模式,切换到控制台(或者Console),复制下面这段代码在控制台后按回车键

var script=document.createElement("script"); 
script.type="text/javascript"; 
script.src="https://code.jquery.com/jquery-1.12.4.min.js"; 
document.getElementsByTagName('head')[0].appendChild(script);

分解步骤图如下:

(1).按F12后,切换到控制台(或者Console)

(2).将代码复制到控制台(或者Console)中,点击回车执行代码

2.如果是大篇幅的文章,先点击继续阅读,将整篇文章加载出来(重要!!!)再执行下一步

切记一定要把整篇文章都加载完!!!就是每一页都不是空的,一直拉到最下面看看有没有还没加载出来的页面,不然直接到第3步的话,复制下来的文字会有漏。

注意如果文章有很多页的话,不是只点击一次“继续阅读”就会加载完,每次点都只是加载几十页而已,一定要点完全部的“继续阅读”!!!

3.使用jq代码将所有文字样式的段落的纯文本提取出来

复制下面这段代码在控制台(或者Console)后按回车键(通过分析可以知道"reader-word-layer"是每个段落的通用样式)

$(".reader-word-layer").text()

分解步骤图如下:

(1).将代码复制到控制台(或者Console)中,点击回车执行代码,结果图如下:

(2).鼠标一直拉到控制台(或者Console)最下方,我们可以看到如下图页面,点击复制就可以将纯文本复制出来,也可以点击显示更多信息,将纯文本在控制台显示出来

4.根据自己需要,将复制过来的文本调整好格式即可。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MrZhouGx

觉得对你有用的话可以支持一下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值