自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Python爬虫常用的几个方法

-- codeing = utf-8 --,开头的这个是设置编码为utf-8 ,写在开头,防止乱码。爬取强大的BD页面,打印页面信息# 第一个爬虫示例,爬取百度页面import requests #导入爬虫的库,不然调用不了爬虫的函数response = requests.get("http://www.baidu.com") #生成一个response对象response.encoding = response.apparent_encoding #设置编码格式print("状态.

2021-12-28 08:40:18 598

原创 Python爬虫的基本原理

爬虫是 模拟用户在浏览器或者App应用上的操作,把操作的过程,实现自动化的过程。实现自动化的过程分为四个阶段:1、查找域名所对应的IP地址。2、浏览器首先访问的是DNS(Domain Name System,域名系统),dns的主要工作就是把域名转换成相应的IP地址向IP对应的服务器发送请求。3、服务器响应请求,返回网页内容。4、浏览器显示网页内容。总结:网络爬虫要做的,简单来说,就是实现浏览器的功能。通过指定url,直接返回给用户所需要的数据, 而不需要一步步人工去操纵浏览器获取。

2021-12-21 10:03:21 923

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除