如何复制网页上的任何内容(比如百度文库)

本文介绍了一种简单(但可能不适用于所有情况)的方法来复制网页上的内容,尤其是那些受限制的页面,如百度文库。通过理解DOM原理,可以绕过JavaScript和CSS的复制阻止机制,通过查看选定源码来提取文字。以Firefox为例,展示如何操作,将DOM源码中的文字复制出来。文章还提到可以进一步编写脚本来自动化这一过程。
摘要由CSDN通过智能技术生成

目的

许多网页都不允许复制,只有进行开通VIP,注册用户,使用专业工具等才能完成ctrl+c和ctrl+v等简单操作。本文提供了一种比较简(cu)单(bao)的解决方案。

注意!

这篇文章话很直(bie)率(niu)!也不一定有效!甚至可能产生失误!请谨慎阅读!

原理(大神请略过)

Web页面的结构是基于DOM树的。Web的内容会在DOM节点上体现。只要复制DOM节点上的内容,就可以获取页面上呈现的内容了。此外,一般的禁止复制都是用Javascript/CSS实现一些DOM属性的控制,或者对copy事件的监听。这可以有效地防止对web内容的直接复制,但不影响对部分DOM源代码的阅读。我们只要从这些DOM源代码里提取文字内容,即可。

举例(百度文库)

在这里插入图片描述我们先选择需要复制的内容,然后右键弹出菜单。
在这里插入图片描述这里以Firefox 72 英文版为例,选择“View Selection Source“(查看选择的源码)。会弹出一个代码窗口。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值