自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 如何安装selenium

在anaconda中安装selenium操作

2022-06-08 21:58:30 179 1

转载 python中爬取网页数据时中文乱码的解决方法

在我们爬取网页源代码时,尝尝会出现中文乱码的问题,加入如下代码可解决问题,亲测有用。page_text = response.text.encode("latin1").decode("utf-8-sig")

2022-05-24 18:22:12 2617 1

原创 python爬取静态网页中的图片案例

文章目录前言一、正则解析的案例二、问题三、仅供学习使用前言聚焦爬虫的意思是爬取页面中指定的页面内容:数据解析包括正则解析bs4解析(python独有)xpath解析一、正则解析的案例我们爬取的是一家图片网站,网址是:https://desk.zol.com.cn/fengjing/1.htmlimport requestsimport osimport reif __name__ == "__main__": if not os.path.exists('./pictur

2022-05-24 12:34:18 308

原创 python爬取图片的注意点

我们在爬取数据时绝大部分是文字或者是数字,如果爬取的数据是图片,如何进行持久化存储呢?我们可以用content来返回二进制的图片数据。之后以wb模式写入文件。import requestsif __name__ == "__main__": url='https://fzn.cc/wp-content/uploads/2020/11/640-126.jpg' img_data = requests.get(url=url).content#content返回的是二进制形式的图片数据

2022-05-20 12:23:38 247

原创 python查看当前工作目录的路径以及修改路径

python查看当前工作目录以及修改路径

2022-05-18 01:10:56 1470

原创 python爬虫翻页操作——ajax肯德基餐厅门店信息爬取

python爬虫翻页操作——ajax肯德基餐厅门店信息爬取

2022-05-18 00:57:25 1290

原创 python爬虫requests模块的编码流程

Requests模块的编码流程1.指定url url ='https://www.baidu.com/s?tn=25017023_5_dg&ch=1&ie=UTF-8'#1.指定url2.发送请求主要用到response.get()函数和response.post函数response.get()函数 response = requests.get(url=url,params=param, headers=head)#2.发起请求get函数的url参数就是你指定的url;

2022-05-16 01:24:30 1927

翻译 python绝对路径和相对路径

今天记录一下python绝对路径和相对路径的问题提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录一、绝对路径二、相对路径三、如何查看当前所在目录提示:以下是本篇文章正文内容,下面案例可供参考一、绝对路径E:\python\爬虫课件的三种表示方法①由windows下文件目录复制而来的路径,“\”在python中是作为转义符使用,所以在python中若想使用windows下的路径标识,前面要加一个r,r的全称是raw string,即原始字符串常量,可以让字符保持原来的

2022-05-15 00:33:49 16224

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除