Python爬虫
文章平均质量分 61
卷橘
一条在底层挣扎的咸鱼。
展开
-
Tesserocr报错:“RuntimeError: Failed to init API, possibly an invalid tessdata path:”解决办法
爬虫小白在尝试使用tesserocr时报错这个异常。“RuntimeError: Failed to init API, possibly an invalid tessdata path:”异常原因:因为python找不到tessdata文件夹导致的。解决办法:找到自己安装Tesseract-OCR的目录,将其中的tessdata复制一份到你的python目录文件夹中,放入与Lib同级目录中。这样就解决这个异常了,重新运行就没问题了。...原创 2021-06-19 16:16:52 · 1905 阅读 · 0 评论 -
selenium报错“selenium.common.exceptions.WebDriverException: Message: ‘chromedriver‘ ”解决办法
爬虫小白在尝试使用selenium时报错这个异常。selenium.common.exceptions.WebDriverException: Message: ‘chromedriver‘异常原因:因为selenium模拟的客户端对浏览器的操作,但相应浏览器的驱动版本不匹配导致的。解决办法:1. 需要先了解我们当前浏览器的版本,打开浏览器,在地址栏输入 chrome://version/ 便可以查看到谷歌当前的版本号。“Google Chrome:” 这一行。在这里我的是91.0.4472原创 2021-06-13 15:26:12 · 6720 阅读 · 2 评论 -
咸鱼笔记:Python爬虫基础【二】——网页基础知识
文章目录前言网页的基本组成一、URI和URL二、超文本三、HTTP 和 HTTPS四、HTTP请求过程Network组件查看请求和响应五、HTTP请求1.请求方法2.请求的网址3.请求头4.请求体六、HTTP响应1.响应状态码2.响应头3.响应体总结前言在平常浏览网页中,每个网站页面都各有特色各不相同,那么你是否想过它是怎么才可以呈现出这么有特色的样子的?其实,这都是根据网页的基本组成等方面基础上加以设计丰富起来的。本章我们就来了解一下网页的基本组成、结构和节点等内容。网页的基本组成网页实际上可以转载 2021-06-11 01:27:13 · 600 阅读 · 0 评论 -
咸鱼笔记:Python爬虫基础【一】——HTTP基础知识
文章目录前言HTTP 基本原理一、URI和URL二、超文本三、HTTP 和 HTTPS四、HTTP请求过程Network组件查看请求和响应六、Python的常用运算符七、Python的转义字符八、Python的基本数据类型Python的List:Python的Tuple:Python的set集合:Python的Dict:总结前言在学习爬虫之前,还需要了解一些基础知识,如 HTTP 原理、网页的基础知识、爬虫的基本原理、Cookies 的基本原理等。HTTP 基本原理一、URI和URLURI: U原创 2021-03-07 13:19:15 · 544 阅读 · 1 评论