python3爬虫初探（二）之requests

最新推荐文章于 2021-10-02 21:26:18 发布

Soyoger

最新推荐文章于 2021-10-02 21:26:18 发布

阅读量736

点赞数

分类专栏： Python+Python数据分析文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_36330643/article/details/78182917

版权

Python+Python数据分析专栏收录该内容

98 篇文章 4 订阅

订阅专栏

关于请求网页，不得不提requests这个库，这是爬虫经常用到的一个第三方库，用pip安装即可。

requests用法很多，这里只写一些基础的，其他高级功能可参考官方文档。

import requests

url = 'http://www.baidu.com'
#这里用get方法用来请求网页，其他还有post等方法来请求网页
data = requests.get(url)

print(data)
#<Response [200]>

print(data.text)#这里的 .text 就等同于上一篇中的 read()
#此时同样打印出网页源码
#<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="

关于requests还有一些其他用法对我们已有的爬虫程序也很有用。

code = data.encoding#获取页面的编码方式
print(code)
#utf-8

page_status = data.status_code#获取状态码，检查是否请求成功
print(page_status)
#200

这些是requests的基础用法,爬虫开始掌握这些简单的用法就可以啦。后面还会继续对requests进行总结。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Soyoger

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Requests库网络爬虫实战一

sk_berry的博客

07-20

502

Requests库网络爬虫实战实例一：京东商品页面的爬取实例二：亚马逊商品页面的爬取实例三：京东商品页面的爬取实例一：京东商品页面的爬取首先打开京东页面:https://www.jd.com/ 选择一个商品，这个时候就得到了该商品的URL链接，接着按照以下程序进行编程： import requests r = requests.get("https://item.jd.com/2967929.html") print(r.status_code) print(r.encoding) 我们首先

【神器啊】比requests还好用的Python高效爬虫框架

m0_59485658的博客

07-07

198

Let's go简单来说，协程是一种基于线程之上，但又比线程更加轻量级的存在。对于系统内核来说，协程具有不可见的特性，所以这种由程序员自己写程序来管理的轻量级线程又常被称作 "用户空间线程"。...

参与评论您还未登录，请先登录后发表或查看评论

爬虫实验报告.docx

01-31

爬虫

Python爬虫 --requests库实践

猴子饲养员的博客

10-29

437

import requestsget请求 response = requests.get(url, params, kwargs) response = requests.get(url) params = {"key":"value"} response = requests.get(url, params = params

初学爬虫requests库（小实验）

bbW.的博客

01-08

347

** 初学爬虫request库（小实验） ** 编写代码，使用requests库，得到 http://www.webscrapingfordatascience.com/usercheck/ 的页面内容网站页面内容：请求头：附上代码;import requests link = "http://www.webscrapingfordatascience.com/usercheck/" headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; W

爬虫笔记(一)——Requests库

Mr.Q_LuLu的博客

10-31

993

本文超详细整理了爬虫当中Requests库的各种知识点，满满的干货，非常适合收藏起来复习用哦~，希望能够对你有所帮助。

Python爬虫初探：使用Requests和BeautifulSoup

Python爬虫之所以备受推崇，有以下几个原因： - Python语言简洁、易学易用，适合初学者入门。 - Python拥有强大的第三方库和工具，如Requests、BeautifulSoup、Scrapy等，能够简化开发流程。 - Python具有丰富的...

Python爬虫初探：使用Requests库获取网页内容

# 1. I. 简介爬虫作为一个自动化程序，在网络上“爬取”... Python爬虫简介 Python作为一种优雅、简洁且功能丰富的编程语言，被广泛应用于爬虫开发。Python以其强大的生态系统和简洁易读的语法，成为爬虫领域的首

Python爬虫初探（六）——爬虫之xpath实战（爬取高考分数线信息）

brilliant666的博客

07-27

2271

上一章我们讨论了xpath的简单使用，这次我们就来实际应用一下xpath，看看它使用有多方便。

Python爬虫初探（四）——爬虫之正则表达式实战（爬取图片）

brilliant666的博客

07-27

2745

上一篇文章我们介绍了正则表达式的用法，这次就来实际操作一下，体会正则表达式的方便。

python3爬虫初探（五）之从爬取到保存

春华秋实

10-09

2390

想一想，还是写个完整的代码，总结一下前面学的吧。 import requests import re # 获取网页源码 url = 'http://www.ivsky.com/tupian/xiaohuangren_t21343/' data = requests.get(url).text #正则表达式三部曲 # regex = r''#匹配网址 pa = re.compile(r

python爬虫实验报告_python爬虫实验

weixin_39532019的博客

11-20

3089

原博文2013-06-28 13:30 −那天在新浪微博上看到北北出的题目，由于最近也在做类似的爬虫研究，所以就有了这个实验。后来在QQ上和北北说了下，要求是啥都抓，就抓乌云的。。。然后就开始了。。第一个版本如下，后续不断改进直到满足需求： import urllib2; from sgmllib import SGMLParser...相关推荐2013-06-28 14:17 −改进了一...

python requests爬虫——爬取李开复博客信息（包括javascript部分信息）

weixin_46689344的博客

10-02

945

今天是国庆假期第二天，已经玩了一天了，今天整理一下前两天写的数据分析作业思路，给实验报告打一下底稿。供对爬虫有兴趣的小伙伴们参考，也希望给实验没完成的同学提供一点小小的帮助。任务要求。 1）分析页面结构，确定待抓取的数据项，至少应抓取文章标题、发表时间、正文内容、文章URL等，可以根据选择的抓取目标的内容特点增加额外的数据项。（如抓取新浪博客时可以额外抓取标签、分类、阅读数、评论数等数据项），新闻类可以额外抓取作者、新闻来源等数据项。注意：标签、分类都是数组，应按...

python爬虫实验报告_10个python爬虫入门实例(小结)

weixin_39913472的博客

11-20

1668

昨天带伙伴萌学习python爬虫，准备了几个简单的入门实例涉及主要知识点:web是如何交互的requests库的get、post函数的应用response对象的相关函数，属性python文件的打开，保存代码中给出了注释，并且可以直接运行哦如何安装requests库(安装好python的朋友可以直接参考，没有的，建议先装一哈python环境)windows用户，Linux用户几乎一样:打开cmd输入...

使用Requests库来进行爬虫的详解

不思量

10-17

1万+

Requests是用Python编写，基于urllib，采用Apache2 Licensed开源协议的HTTP库。它比urllib更方便，可以节约我们大量的工作，完全满足HTTP测试需求。安装： pip3 install requests 使用实例： import requests response=requests.get('https://www.baidu.com') print(ty...

一、最简单的爬虫（python3 爬虫小白系列文章）

热门推荐

weixin_42530834的博客

06-23

5万+

运行平台： Windows Python版本： Python3.x IDE： Pycharm 2017.2.4 看了崔老师的python3网络爬虫实战，受益匪浅，为了帮助自己更好的理解这些知识点，于是打算趁着这股热乎劲，针对爬虫实战进行一系列的教程。阅读文章前，我会默认你已经具备一下几个要素 1.python3安装完毕 Windows： https://www....

python爬虫实验报告怎么写_用python写的一次爬虫经历

weixin_39583521的博客

12-03

1283

昨晚帮朋友到一个天津校园信息网站抓天津小学名称、地址等信息，里面的坑还是不少，记录一下。该网站的网页并没有采用ajax交互，而是通过服务端渲染整个页面后发送到前端，之前抓数据最简单的就是通过抓包抓到它的数据接口，之后从这个接口取数据就行。现在方式变了，那就用python丰富的库来写个爬虫来抓取。这里用的是urllib2来返回网页数据，首先遇到就是一个编码问题，通过网页的源码里的charset可以看...

python网络爬虫实验报告_常用的Python爬虫库及脚本爬虫

weixin_39892481的博客

11-24

351

一次失败的实验-可能是被win下环境惯坏了，今天一堆问题。。。-wget 获取spider_lib.zip后就乱了。1.在终端输完wget获取命令直接中间enter就一直报错，还产生了个wget.log好像是日志。2.在GVim里编好requests_get.py后，再在终端输入执行命令，一直报错返回的“找不到这个目录或文件”待我确认文件名没错后。然后不报错了，但没有返回状态码。。。3.在GVim...

python爬虫（二）-requests库学习总结

Yangirl_Sunny的博客

04-18

1106

Requests是用python语言基于urllib编写的，但相对比于urllib.request库的繁琐，python提供了一套更为便捷的网络请求方法即requests库。一.基本方法 1.GET请求 get这个API所写的底层函数如下，必须传参为URL，可选参数有params以及其他自定义等等,参数传入为字典形式，requests会自动编码成url形式。查看源码：（1）第一层源码（2...

Python基础爬虫：BeautifulSoup与requests实例

在这个简单的Python爬虫实例中，我们将学习如何使用Python编程语言和两个常用的库，BeautifulSoup和requests，来自动化从网络上的网页抓取数据。爬虫是一种工具，主要用于批量处理网页抓取任务，以便收集、分析和...