python 爬虫之 爬取网页并保存(简单基础知识)

抓取网页效果图(代码在最后):
在这里插入图片描述

基础知识认识

首先导入所需要的库

from fake_useragent import UserAgent#头部库
from urllib.request import Request,urlopen#请求和打开
from urllib.parse import quote#转码
from urllib.parse import urlencode#转码

先获取一个简单的网页

url = "https://www.baidu.com/?tn=02003390_43_hao_pg"  #获取一个网址
response = urlopen(url)#将网址打开
info = response.read()#读取网页内容
info.decode()#将其转码,utf-8

在这里插入图片描述
小知识

response.getcode()  #查看状态码
response.geturl()  #查看当前网址
response.info() #返回服务器想赢的HTTP报头

在这里插入图片描述

随机获取一个头部

导入专用库
from fake_useragent import UserAgent#头部库
UserAgent().random
ua.choram#这两种都可以

在这里插入图片描述

就可以随机获得一个头部。

将头部添加到headers中

首先将随机获得的头部保存在headers中
headers = {
   "User-Agent":UserAgent()
  • 10
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黎明之道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值