python 制作动态网页_Python3如何抓取JS动态生成的html网页功能实现示例

最新推荐文章于 2023-12-22 14:13:00 发布

weixin_39588104

最新推荐文章于 2023-12-22 14:13:00 发布

阅读量273

点赞数

文章标签： python 制作动态网页

这篇文章主要介绍了Python3实现抓取javascript动态生成的html网页功能,结合实例形式分析了Python3使用selenium库针对javascript动态生成的HTML网页元素进行抓取的相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python3实现抓取javascript动态生成的html网页功能。分享给大家供大家参考，具体如下：

用urllib等抓取网页，只能读取网页的静态源文件，而抓不到由javascript生成的内容。

究其原因，是因为urllib是瞬时抓取，它不会等javascript的加载延迟，所以页面中由javascript生成的内容，urllib读取不到。

那由javascript生成的内容就真的没有办法读取了吗？非也！

这里要介绍一个python库：selenium，本文使用的版本是 2.44.0

先安装：pip install -U selenium

下面用三个例子来说明其用法：

【例0】

打开一个Firefox浏览器

载入所给url地址的页面from selenium import webdriver

browser = webdriver.Firefox()

browser.get('http://www.baidu.com/')

【例1】

打开一个Firefox浏览器

载入百度主页

搜索 “seleniumhq”

关闭浏览器from selenium import webdriver

from selenium.webdriver.common.keys import Keys

browser = webdriver.Firefox()

browser.get('http://www.baidu.com')

assert '百度' in browser.title

elem = browser.find_element_by_name('p') # Find the search box

elem.send_keys('seleniumhq' + Keys.RETURN) # 模拟按键

browser.quit()

【例2】

Selenium WebDriver 常用于网络程序的测试。下面是一个使用Python标准库 unittest 的例子:import unittest

class BaiduTestCase(unittest.TestCase):

def setUp(self):

self.browser = webdriver.Firefox()

self.addCleanup(self.browser.quit)

def testPageTitle(self):

self.browser.get('http://www.baidu.com')

self.assertIn('百度', self.browser.title)

if __name__ == '__main__':

unittest.main(verbosity=2)

以上就是Python3如何抓取JS动态生成的html网页功能实现示例的详细内容，更多请关注php中文网其它相关文章！

article_wechat2021.jpg?1111

本文原创发布php中文网，转载请注明出处，感谢您的尊重！

weixin_39588104

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 制作动态网页_Python3如何抓取JS动态生成的html网页功能实现示例

这篇文章主要介绍了Python3实现抓取javascript动态生成的html网页功能,结合实例形式分析了Python3使用selenium库针对javascript动态生成的HTML网页元素进行抓取的相关操作技巧,需要的朋友可以参考下本文实例讲述了Python3实现抓取javascript动态生成的html网页功能。分享给大家供大家参考，具体如下：用urllib等抓取网页，只能读取网页的静态源文...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。