python打开js文件_python读取js文件中的内容?

使用Python抓取网站JavaScript文件的挑战与解决方案,包括BeautifulSoup的限制和如何借助Selenium模拟浏览器行为抓取动态加载的内容。
摘要由CSDN通过智能技术生成

我扫描一些网站并希望获得所有的java脚本文件名称和内容

我尝试使用BeautifulSoup的python请求,但无法获取脚本详细信息和http://contents.am我错过了什么?

我一直在尝试很多方法来寻找,但我觉得在黑暗中磕磕绊绊。这是我正在尝试的代码

导入请求

来自bs4 进口 BeautifulSoup

r =请求。得到(“http://www.marunadanmalayali.com/”)

汤= BeautifulSoup(r.content)

您可以使用以下代码获取所有链接的JavaScript代码:soup.find_all('script')返回

一个列表理解这里使用循环遍历其返回的列表中的所有元素soup.find_all('script')。

i是一个类似于dict的对象,用于.get('src')检查它是否具有src属性。如果没有,请忽略它。否则,将其放入一个列表(l在示例中调用)。

输出,在这种情况下如下所示:

[ 'http://adserver.adtech.de/addyn/3.0/1602/5506153/0/6490/ADTECH ; loc = 700; target = _blank; grp = [group]',

'http://tags.expo9。 exponential.com/tags/MarunadanMalayalicom/ROS/tags.js '

'http://tags.expo9.exponential.com/tags/MarunadanMalayalicom/ROS/tags.js ',

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值