完全获取python中javascript文件及其内容的所有名称

这篇博客探讨了如何使用Python的BeautifulSoup和selenium模块来获取网页中JavaScript文件的名称和内容。作者遇到的问题是,一些JavaScript链接在HTML源代码中不可见,需要通过运行JavaScript来获取。解决方案是利用selenium模拟浏览器执行JavaScript,从而获取原本隐藏的链接。
摘要由CSDN通过智能技术生成

扫描一些网站,并希望获得所有的java脚本文件名称和内容。我尝试使用BeautifulSoup的python请求,但无法获取脚本详细信息和contents.am我错过了什么?

我一直在尝试很多方法来寻找,但我觉得在黑暗中磕磕绊绊。这是我正在尝试的代码

导入请求
来自bs4 进口 BeautifulSoup
r =请求。得到(“http://www.marunadanmalayali.com/”)
汤= BeautifulSoup(r.content)

您可以使用以下代码获取所有链接的JavaScript代码:

  • soup.find_all('script')返回<script>页面中所有标签的列表。

  • 一个列表理解这里使用循环遍历其返回的列表中的所有元素soup.find_all('script')

  • i是一个类似于dict的对象,用于.get('src')检查它是否具有src属性。如果没有,请忽略它。否则,将其放入一个列表(l在示例中调用)。

输出,在这种情况下如下所示:

[ 'http://adserver.adtech.de/addyn/3.0/1602/5506153/0/6490/ADTECH ; loc = 700; target = _blank; grp = [group]',
 'http://tags.exp
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值