爬虫MOOC 第一周入门

最新推荐文章于 2024-04-25 22:20:02 发布

Dr_David_S

最新推荐文章于 2024-04-25 22:20:02 发布

阅读量1.5k

点赞数

分类专栏：爬虫 MOOC 文章标签：爬虫 python

本文链接：https://blog.csdn.net/qq_27469517/article/details/60962150

版权

讲师嵩天讲解爬虫基础知识，包括安装Request库、理解robots协议，通过实例展示京东、亚马逊爬虫的实现，探讨如何处理返回错误。还涉及网络图片爬取、IP地址归属地查询，引导初学者入门网络数据抓取。

摘要由CSDN通过智能技术生成

Python网络爬虫与信息提取

讲师：嵩天

第一步安装测试Request库

# -*- coding:utf-8 -*-
import requests
r = requests.get("http://www.baidu.com")
# requests 是 Response对象，包含了爬虫返回的内容
# get 是 Request对象
print r.status_code # 200 表示链接上了，404 表示失败
r.encoding = 'utf-8'
print r.textPython