目录
2.如果是大篇幅的文章,先点击继续阅读,将整篇文章加载出来(重要!!!)再执行下一步
前言
现在的百度文库已经不能像以前一样使用冰点文库等软件来免费下载文档了,而且限制了不可以直接Ctrl+C,Ctrl+V来复制粘贴了。另外我发现连右键都不可以了,那我们还想继续复制的话,能有什么办法呢?于是就有了这篇文章,利用前端知识来复制百度文库中整一篇doc文档的纯文字。我一开始是尝试直接用jq的写法,不过可以试出来,百度文库的页面是没有加载jq的,于是我需要做的就是先动态加载jq,然后找出所有段落的通用样式,通过jq去获取这个样式的文本,就可以得到我们想要的结果了。下面就让我们一步步来:
1.动态加载jq
按F12进入开发者模式,切换到控制台(或者Console),复制下面这段代码在控制台后按回车键
var script=document.createElement("script");
script.type="text/javascript";
script.src="https://code.jquery.com/jquery-1.12.4.min.js";
document.getElementsByTagName('head')[0].appendChild(script);
分解步骤图如下:
(1).按F12后,切换到控制台(或者Console)
(2).将代码复制到控制台(或者Console)中,点击回车执行代码
2.如果是大篇幅的文章,先点击继续阅读,将整篇文章加载出来(重要!!!)再执行下一步
切记一定要把整篇文章都加载完!!!就是每一页都不是空的,一直拉到最下面看看有没有还没加载出来的页面,不然直接到第3步的话,复制下来的文字会有漏。
注意如果文章有很多页的话,不是只点击一次“继续阅读”就会加载完,每次点都只是加载几十页而已,一定要点完全部的“继续阅读”!!!
3.使用jq代码将所有文字样式的段落的纯文本提取出来
复制下面这段代码在控制台(或者Console)后按回车键(通过分析可以知道"reader-word-layer"是每个段落的通用样式)
$(".reader-word-layer").text()
分解步骤图如下:
(1).将代码复制到控制台(或者Console)中,点击回车执行代码,结果图如下:
(2).鼠标一直拉到控制台(或者Console)最下方,我们可以看到如下图页面,点击复制就可以将纯文本复制出来,也可以点击显示更多信息,将纯文本在控制台显示出来