长江中下游最靓的仔-CSDN博客

原创如何安装selenium

在anaconda中安装selenium操作

2022-06-08 21:58:30 284 1

转载 python中爬取网页数据时中文乱码的解决方法

在我们爬取网页源代码时，尝尝会出现中文乱码的问题，加入如下代码可解决问题，亲测有用。page_text = response.text.encode("latin1").decode("utf-8-sig")

2022-05-24 18:22:12 2777 1

文章目录前言一、正则解析的案例二、问题三、仅供学习使用前言聚焦爬虫的意思是爬取页面中指定的页面内容：数据解析包括正则解析bs4解析（python独有）xpath解析一、正则解析的案例我们爬取的是一家图片网站，网址是：https://desk.zol.com.cn/fengjing/1.htmlimport requestsimport osimport reif __name__ == "__main__": if not os.path.exists('./pictur

2022-05-24 12:34:18 436

原创 python爬取图片的注意点

我们在爬取数据时绝大部分是文字或者是数字，如果爬取的数据是图片，如何进行持久化存储呢？我们可以用content来返回二进制的图片数据。之后以wb模式写入文件。import requestsif __name__ == "__main__": url='https://fzn.cc/wp-content/uploads/2020/11/640-126.jpg' img_data = requests.get(url=url).content#content返回的是二进制形式的图片数据

2022-05-20 12:23:38 326

原创 python查看当前工作目录的路径以及修改路径

python查看当前工作目录以及修改路径

2022-05-18 01:10:56 1651

原创 python爬虫翻页操作——ajax肯德基餐厅门店信息爬取

python爬虫翻页操作——ajax肯德基餐厅门店信息爬取

2022-05-18 00:57:25 1505

原创 python爬虫requests模块的编码流程

Requests模块的编码流程1.指定url url ='https://www.baidu.com/s?tn=25017023_5_dg&ch=1&ie=UTF-8'#1.指定url2.发送请求主要用到response.get()函数和response.post函数response.get()函数 response = requests.get(url=url,params=param, headers=head)#2.发起请求get函数的url参数就是你指定的url；

2022-05-16 01:24:30 2097

翻译 python绝对路径和相对路径

今天记录一下python绝对路径和相对路径的问题提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、绝对路径二、相对路径三、如何查看当前所在目录提示：以下是本篇文章正文内容，下面案例可供参考一、绝对路径E:\python\爬虫课件的三种表示方法①由windows下文件目录复制而来的路径，“\”在python中是作为转义符使用，所以在python中若想使用windows下的路径标识，前面要加一个r，r的全称是raw string，即原始字符串常量，可以让字符保持原来的

2022-05-15 00:33:49 17286

weixin_45619473的博客