python网络爬虫
文章平均质量分 67
sunchengquan
这个作者很懒,什么都没留下…
展开
-
python对json的操作及实例解析
Json简介:Json,全名 JavaScript Object Notation,是一种轻量级的数据交换格式。它基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。(来自百度百科)python关于json文原创 2017-10-07 17:23:44 · 11069 阅读 · 0 评论 -
Selenium3+Python3+PhantomJS配置及测试解析
最近学习爬虫,遇到动态触发,异步加载,无法直接爬取数据,那么问题出现,解决的方法总是有的,需要用到两个工具:Selenium和PhantomJS。下面介绍其基本概念和配置过程概念Selenium(浏览器自动化测试框架):是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Fire原创 2017-10-04 21:57:14 · 4330 阅读 · 2 评论 -
Selenium3+Python3+Firefox56配置及测试解析
终于启动火狐了。。。。。。1 使用pip安装Seleniumpip install -U selenium 可以查看博客内容pip show selenium ,查看当前版本 2 下载最新的Firefox记得还要下载火狐驱动,selenium3以后需要单独下载 IE 和Chrome的驱动同理 驱动geckodriver 下载地址:https://github.com/mozilla/gecko原创 2017-10-06 22:34:17 · 1287 阅读 · 0 评论 -
Python正则表达式实战(示例)
正则表达式是处理字符串的强大的工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符import rea = 'xz123'b = re.findall('x....',a)print(b)运行结果:['xz123']*匹配0个或多个的表达...原创 2017-11-20 16:07:20 · 2440 阅读 · 0 评论 -
python操作selenium
Selenium 自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器参考SeleniumPython文档1 简单使用"""#driver.get方法会打开请求的URL#webdriver提供了许多寻找页面元素的方法,find_element_by_*的方法#输入来文本然后模拟点击了回车,就像我们敲击键盘一样。我们可以利用 Ke...原创 2018-07-04 21:23:34 · 1159 阅读 · 0 评论