Selenium
凝聚才华
种一棵树最好的时间是十年前,其次是现在。
很喜欢“毛竹”:毛竹4年也只不过长3厘米,5年后以每天足足30厘米的速度生长着。这样只用6周就可以长到15米
展开
-
Selenium之学习杂记(八)
单元测试为什么要写单元测试怎样写单元测试单元测试的演示单元测试示例Selenium的单元测试美化报告 顾名思义,单元测试指的是对软件中的最小可测试单元进行检查和验证。 为什么要写单元测试 程序员的智慧是有限的,但系统的复杂度是无限的。随着系统复杂性的增加,你必须依靠其他工具来帮助减少问题。 单元测试的作用更多地体现在代码的维护上,而不是在代码的编写上。有人可能会想,我们打开程序界面,一个一个地单击按钮,不就知道功能是否实现了吗?何必要浪费时间再写一个单元测试呢?这么想确实没有错,并且在早期确实有一部分公司翻译 2020-08-11 14:40:05 · 423 阅读 · 0 评论 -
Selenium之学习杂记(七)
基于淘宝商品的实战准备工作流程简述代码解读 以淘宝商品为例子,阐述如何采集复杂网站的页面数据,展示较为新颖的实现方法。利用Selenium爬取淘宝商品数据,得到淘宝中与某一关键词对应的商品名称、价格和店铺名称等信息。 准备工作 本次爬取的过程中,我们会使用到一个叫作pyquery的库。这个库依赖于lxml,而lxml依赖于Visual C++ 14。在使用pip安装的过程中,如果在建立lxml.etree扩展的时候失败了,就会提示我们需要安装Visual C++ 14。 所以,直接使用pip安装很可能会报翻译 2020-08-11 13:12:01 · 528 阅读 · 0 评论 -
Selenium之学习杂记(六)
基于猫眼电影的实战网站分析最初的测试代码进一步完善之后的测试代码 网站分析 在对网站进行数据采集之前,我们要先看一下网站是否禁止我们的这种行为。打开猫眼电影的robots.txt看一看。网站一般都存在robots.txt,用于告诉爬虫和搜索引擎(实际上也是爬虫)哪些页面可以获取,哪些页面不可以获取。 采集猫眼电影的TOP100榜单。 这里有几个要获取的要素:“霸王别姬”,这是电影名;主演姓名,这也是要获取的内容;上映时间和电影的受欢迎程度并不存在具体的关联,所以不在我们考虑的范围内;电影的评分,客户肯定优翻译 2020-08-10 17:23:12 · 252 阅读 · 1 评论 -
Selenium之学习杂记(五)
数据的编解码和处理读写CSV文件读写JSON文件将字典转化为XMLBase64编码词性分析、统计分析NLTK散列表 如果你使用过API,那么你很可能会喜欢用API中那些已经处理好的数据。遗憾的是,在实际工作中,API的使用次数总是少的,大多数时候,都需要我们自己来进行数据的挖掘、整理和分析等操作。既然和互联网打交道,就少不了对各种数据类型进行转换。需要转换数据类型的根本原因是数据的存储方式和应用目的不同,计算机对不同类型的数据有不同的存储方式,比如,有的为了节省存储空间,有的则为了使用方便等。这些数据在编解翻译 2020-08-10 13:12:41 · 303 阅读 · 0 评论 -
Selenium之学习杂记(四)
基于今日头条的实战[稍微复杂]通过Selenium访问百度热词通过Selenium搜索相关热词获取第一条结果定位元素—— 抓取内容存储数据 通过Selenium访问百度热词 我们的目标网站为百度搜索风云榜。先打开百度搜索风云榜网站观察一下,我们的 为了获取元素,首先要进行元素定位。在网页中按F12键打开开发者工具,对实时热点这几条消息进行定位,右击并获取XPath。然后读者就会惊讶的发现,它的XPath都很类似,不同的只是中间一个叫作li的标签名。这就意味着,我们只需要更改li标签对应的数字,就可以完成对翻译 2020-08-07 17:57:13 · 319 阅读 · 0 评论 -
Selenium之学习杂记(三)
基于Python官网的简单实战通过Selenium访问Python官网通过JavaScript修改Python官网的标题在搜索框搜索获取latest news部分Selenium的等待 通过Selenium访问Python官网 代码如下: # 导入selenium库、time库 from selenium import webdriver import time # 启动浏览器,打开python官网 driver = webdriver.Chrome() driver.get("https://www.p翻译 2020-08-07 11:00:15 · 228 阅读 · 0 评论 -
Selenium之学习杂记(二)
Selenium之学习杂记(二)元素定位元素定位概述根据ID定位根据 name定位根据XPath定位根据标签名定位根据CSS选择器定位根据链接文本定位根据部分链接文本定位 元素定位 在计算机领域中,页面的最基本组成单元为元素。要确定一个元素,我们需要特定的信息来说明这个元素的唯一特征。 Selenium的8种元素定位方式 元素定位概述 Selenium提供了如下8种定位方式。 定位名称 在Python的selenium对应的方法 ●根据ID定位 find_element_by_id()翻译 2020-08-06 15:26:30 · 251 阅读 · 0 评论 -
Selenium之学习杂记(一)
Selenium之学习杂记(一)Selenium一些概念页面导航启动浏览器打开页面浏览器基本操作拖动窗口cookie的调用使用多个窗口 Selenium一些概念 Selenium官方有一个很经典的回答:“自动化操作的浏览器,就是这样……做你想要做的事情,一切取决于你。” Selenium项目最早是为测试浏览器、网页而诞生的。在大数据时代,Selenium广泛应用于网络爬虫。需要注意的是,Selenium项目并不是单个特定的软件,而是由多个工具组成,每个工具具有特定的功能。 Selenium WebDriv翻译 2020-08-06 13:49:37 · 399 阅读 · 0 评论 -
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
Selenium和ChromeDriver的安装步骤1.前置准备2.Selenium简介和安装3.ChromeDriver的安装4.GeckoDriver的安装5.PhantomJS的安装 1.前置准备 实验条件是在Windows系统下; Windows系统下,已安装Python3(此处建议安装Anaconda3,是Python开发环境,用来管理不同版本的Python环境,自带很多常用软件包以及...原创 2020-03-05 13:24:23 · 864 阅读 · 1 评论
分享