10个Python爬虫入门实例_python 爬虫代码简单例子(1)

最新推荐文章于 2024-07-30 17:23:09 发布

程序员小伊

最新推荐文章于 2024-07-30 17:23:09 发布

阅读量1.1k

点赞数 19

分类专栏：程序员文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/m0_54926105/article/details/138274777

版权

程序员专栏收录该内容

570 篇文章 6 订阅

订阅专栏

print( response.status_code ) #状态码

print( response.text )


### 3. 常用方法之post方法实例，下面还有传参实例

第三个 post方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.post(“http://httpbin.org/post”) #post方法访问

print( response.status_code ) #状态码

print( response.text )


### 4. put方法实例

第四个 put方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.put(“http://httpbin.org/put”) # put方法访问

print( response.status_code ) #状态码

print( response.text )


### 5. 常用方法之get方法传参实例(1)


如果需要传多个参数只需要用&符号连接即可如下：

第五个 get传参方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get(“http://httpbin.org/get?name=hezhi&age=20”) # get传参

print( response.status_code ) #状态码

print( response.text )


### 6. 常用方法之get方法传参实例(2)


params用字典可以传多个

第六个 get传参方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

data = {
“name”:“hezhi”,
“age”:20
}
response = requests.get( “http://httpbin.org/get” , params=data ) # get传参

print( response.status_code ) #状态码

print( response.text )


### 7. 常用方法之post方法传参实例(2) 和上一个有没有很像

第七个 post传参方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

data = {
“name”:“hezhi”,
“age”:20
}
response = requests.post( “http://httpbin.org/post” , params=data ) # post传参

print( response.status_code ) #状态码

print( response.text )


### 8. 关于绕过反爬机制，以zh爸爸为例

第好几个方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get( “http://www.zhihu.com”) #第一次访问知乎，不设置头部信息

print( “第一次,不设头部信息,状态码:”+response.status_code )# 没写headers，不能正常爬取，状态码不是 200

#下面是可以正常爬取的区别，更改了User-Agent字段

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"

}#设置头部信息,伪装浏览器

response = requests.get( “http://www.zhihu.com” , headers=headers ) #get方法访问,传入headers参数，

print( response.status_code ) # 200！访问成功的状态码

print( response.text )


* 信息并保存到本地


因为目录关系，在D盘建立了一个叫做爬虫的文件夹，然后保存信息


注意文件保存时的encoding设置

爬取一个html并保存

import requests

url = “http://www.baidu.com”

response = requests.get( url )

response.encoding = “utf-8” #设置接收编码格式

print(“\nr的类型” + str( type(response) ) )

print(“\n状态码是:” + str( response.status_code ) )

print(“\n头部信息:” + str( response.headers ) )

print( “\n响应内容:” )

print( response.text )

#保存文件
file = open(“D:\爬虫\baidu.html”,“w”,encoding=“utf”) #打开一个文件，w是文件不存在则新建一个文件，这里不用wb是因为不用保存成二进制

file.write( response.text )

file.close()


### 10. 爬取图片，保存到本地

#保存百度图片到本地

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get(“https://www.baidu.com/img/baidu_jgylogo3.gif”) #get方法的到图片响应

file = open(“D:\爬虫\baidu_logo.gif”,“wb”) #打开一个文件,wb表示以二进制格式打开一个文件只用于写入

file.write(response.content) #写入文件

file.close()#关闭操作，运行完毕后去你的目录看一眼有没有保存成功


  知道你对python感兴趣，所以给你准备了下面的资料


### 关于Python技术储备


点击链接直达获取资料（安全链接，大家可放心点击）


[Python学习路线（2023修正版）附涉及资料《Python学习资料》，已经打包好了，自取【ps：需要领取的资料（请备注清楚，查找与发送给你）】。因链接常![](https://img-blog.csdnimg.cn/img_convert/3d66f4d43c5f4f3d98aebef981159b84.png)https://mp.weixin.qq.com/s/UVxw0daFCgAMFhz9cfrjAQ](https://mp.weixin.qq.com/s/UVxw0daFCgAMFhz9cfrjAQ "Python学习路线（2023修正版）附涉及资料")


学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！




**一、Python所有方向的学习路线**

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

![img](https://img-blog.csdnimg.cn/1d40facda2b84990b8e1743f5487d455.png)  
![img](https://img-blog.csdnimg.cn/0fc11d4a31bd431dbf124f67f1749046.png)

**二、Python必备开发工具**

工具都帮大家整理好了，安装就可直接上手！![img](https://img-blog.csdnimg.cn/ff266f529c6a46c4bc28e5f895dec647.gif#pic_center)

**三、最新Python学习笔记**

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

![img](https://img-blog.csdnimg.cn/6d414e9f494742db8bcc3fa312200539.png)

**四、Python视频合集**

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

![img](https://img-blog.csdnimg.cn/a806d9b941c645858c61d161aec43789.png)

**五、实战案例**

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。![img](https://img-blog.csdnimg.cn/a353983317b14d3c8856824a0d6186c1.png)

**六、面试宝典**

![在这里插入图片描述](https://img-blog.csdnimg.cn/97c454a3e5b4439b8600b50011cc8fe4.png)

![在这里插入图片描述](https://img-blog.csdnimg.cn/111f5462e7df433b981dc2430bb9ad39.png)

###### **简历模板**![在这里插入图片描述](https://img-blog.csdnimg.cn/646863996ac44da8af500c049bb72fbd.png#pic_center)




**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**
ter)




**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**