- 博客(4)
- 收藏
- 关注
原创 tesserocr的安装
tesserocr的安装 1.OCR,即Optical Character Recognition,光学字符识别,通过扫描字符翻译成电子文本的过程,然后爬虫将是被结果提交给服务器,达到识别验证码的过程。 2.tesserocr是python的一个OCR识别库,但是它是对tesseract做的一层Python API封装,核心是tesseract。要先安装tesseract。 3.tesseract...
2019-04-28 21:25:42 224
原创 Beautiful Soup的安装
Beautiful Soup的安装 Beautiful Soup是python的一个HTML或者XML的解析库,我们可以用来方便的从网页中提取数据。它拥有强大的API和多样的解析方式。 1.Beautiful Soup依赖于lxml库。 2.安装 pip3 install lxml pip3 install beautifulsoup4 3.验证安装是否成功,能运行出Hello结果,表明安装成功...
2019-04-28 20:57:23 226
原创 PhantomJS的安装
PhantomJS的安装 1.phantomJS是一个无界面的,可脚本变成的webkit浏览器引擎,它支持多种Web标准:DOM操作,CSS原则器,json、Canvas以及SVG. 2.Selenium支持PhantomJS,这样在运行的时候就不会再弹出一个浏览器了。 3.下载PhatomJS: http://phantomjs.org/download.html 4.解压之后将它的bin目录...
2019-04-27 22:09:11 345
原创 ChromeDriver的安装
ChromeDriver的安装 1.只有安装了ChromeDriver,才能驱动Chrome浏览器完成相应的工作。下载地址:https://chromedriver.storage.googleapis.com/index.html 2.chrome浏览器帮助–关于chrome浏览器,点击查看chrome的版本号。下载对应版本号的ChromeDriver. 3.windows下,直接将chro...
2019-04-27 21:16:41 280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人