【Python自学笔记】10个爬虫入门实例，附源码与注释

最新推荐文章于 2024-04-01 13:30:49 发布

世上本无鬼

最新推荐文章于 2024-04-01 13:30:49 发布

阅读量1.6k

点赞数 6

分类专栏：爬虫实战文章标签： python 大数据程序人生数据挖掘自然语言处理

本文链接：https://blog.csdn.net/weixin_57577264/article/details/118965069

版权

本文介绍了Python爬虫的10个入门实例，包括BD页面抓取、HTTP请求方法（get、post、put）、反爬机制、信息保存及图片下载。详细讲解了requests库的使用，提供了带注释的源码，适合初学者。同时提供Python环境安装指南、学习资源及技术交流Q群。

摘要由CSDN通过智能技术生成

在这里插入图片描述

涉及知识点:

web是如何交互的
requests库的get、post函数的应用
response对象的相关函数，属性
Python文件的打开，保存

代码中给出了注释，并且可以直接运行哦

如何安装requests库，没有的，建议先装一下Python环境，windows用户，Linux用户几乎一样:

1.打开cmd输入以下命令即可，如果python的环境在C盘的目录，会提示权限不够，只需以管理员方式运行cmd窗口

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests

2.Linux用户类似(ubantu为例): 权限不够的话在命令前加入sudo即可

sudo pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests

在这里插入图片描述

1.爬取强大的BD页面，打印页面信息

# 第一个爬虫示例,爬取百度页面
 
import requests #导入爬虫的库，不然调用不了爬虫的函数
 
response = requests.get("http://www.baidu.com") #生成一个response对象
 
response.encoding = response.apparent_encoding #设置编码格式
 
print("状态码:"+ str( response.status_code ) ) #打印状态码
 
print(response.text)#输出爬取的信息

2.常用方法之get方法实例

# 第二个get方法实例
 
import requests #先导入爬虫的库，不然调用不了爬虫的函数
 
response = requests.get("http://httpbin.org/get") #get方法
 
print( response.s

最低0.47元/天解锁文章

世上本无鬼

关注

6
点赞
踩
17

收藏

觉得还不错? 一键收藏
11
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录