python3 使用requests获取网页内容

在命令行里输入命令安装模块

 pip install requests
 pip install random

以获取豆瓣网页内容为例

#导入需要用到的模块
import requests
#准备一个网址
url='https://movie.douban.com/top250'
res=requests.get(url) #requests模块会自动解码来自服务器的内容,可以使用res.encoding来查看编码
html=res.text

有些网页需要浏览器头部才能访问,下面使用添加浏览器头部的方法获取网页内容
查找自己浏览器头部的方法,以谷歌浏览器为例:打开一个网页然后点击右键,检查
在这里插入图片描述

#导入需要的模块
import requests
import random
url='https://movie.douban.com/top250'
#准备浏览器头部
User_Agent='Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'
response=requests.get(
    url,
    headers={'User-Agent':random.choice(User_Agent)}) #把头部增加到请求中去
html=response.text

设置请求头部和代理IP

#导入需要的模块
import requests
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值