js获取百度文库页面内容

仅供查看,不可乱来,有钱勿喷;
操作步骤:(如果觉得操作麻烦,请滑到下方自动下载)
1.打开搜索到的百度文库的你需要的word页面

2.打开浏览器控制台(按F12,如果无效,请手动打开)
在这里插入图片描述

3.因为需要获取该部分内容的id,选中控制台左上角的箭头,移动到内容页,旁边的提示文字就是该部分的id。
在这里插入图片描述

4.在console里输入(document.getElementById(id).textContent;)(这里id替换获取的id),回车即可;
在这里插入图片描述
5.控制台内容可直接复制。


快捷下载方式

同样在控制台的console里键入以下代码,可下载你看到那页附近三页word,(不知道为什么不能超过,可能数据传输限制吧,以后想办法优化)

		var i=1;var content="data:text/plain;charset=utf-8,";
		while(i<=document.getElementsByClassName("page-count")[0].textContent.substring(1)){
			content+=document.getElementById("pageNo-"+i).textContent;
			i++;	
		}
		var elementDown=document.createElement('a');
		elementDown.setAttribute('href',content);
		elementDown.setAttribute('download', "downloadWord.docx");
		elementDown.style.display='none';
		document.body.appendChild(elementDown);
		elementDown.click();
		document.body.removeChild(elementDown);	

js代码解析:
document.getElementsByClassName(“page-count”)[0].textContent.substring(1)//获取页面总数
document.getElementById(“pageNo-”+i).textContent;//获取当前页面文本

若是阅读付费文档,请将document.getElementsByClassName(“page-count”)[0].textContent.substring(1)这句替换为你能阅读到的页数,否则会报错。

在这里插入图片描述
在这里插入图片描述

这类方法应该可以在所有禁止复制的页面通用,能快速复制文字。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值