Python网络爬虫笔记(四)——requests与BeautifulSoup

一、requests

request是请求库,用来获取页面信息。

首先记得导入库啊,这个是第三方库,py没有自带,没有安装的小伙伴可以移步我上一篇安装第三方库教程

import requests

介绍几个常用的函数
1> 请求命令

import requests

url = 'https://www.163.com'
resp = requests.get(url)

get用途其实跟构造函数差不多,它的参数不少,我们这里主要用到url和headers两个。
url:学过计网的自然懂,没学过的……嗯简单来说就是要爬取的网站。。。地址吧?(不准确)它其实就是浏览器地址框里那个。
就是这个
headers:请求头,有时候网站会有反爬,加这个可以爬的更真实。这个放到后面讲。

2> 显示状态码

import requests

url = 'https://www.163.com'
resp = requests.get(url)
print(resp.status_code)
# >>200

爬取的状态。如果是200就代表成功了。

3> 显示文本格式的信息

import requests

url = 'https://www.163.com'
resp = requests.get(url)
print(resp.status_code)
print
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值