python之初学爬虫并且将爬回来的数据存为csv文件

最新推荐文章于 2024-05-13 22:06:27 发布

baihuan5059

最新推荐文章于 2024-05-13 22:06:27 发布

阅读量5.3k

点赞数 1

文章标签：爬虫 python 数据库

原文链接：http://www.cnblogs.com/sgy614092725/p/shiguiyu16.html

版权

本文介绍了Python初学者如何使用requests库进行网络爬虫，检测安装成功后，详细讲解request库和response属性。通过爬取中国最好大学排名数据，演示如何将爬取结果保存为CSV文件。

摘要由CSDN通过智能技术生成

一、开发工具：

运行环境： python3.7 win10
python 第三方库： requests (自行安装） >>> cmd --->pip install requests, 具体不做介绍)

二、检测是否安装成功

在命令行中输入python，敲击回车，进入python环境。

再输入以下指令并回车：

　　import requests 如果不报错，那一般是已经安装好了。

三、request库简介：

四、response属性

五、我们用requeses库的个体（）函数访问必应主页20次，打印返回状态，text内容，并且计算text（）属性和content属性返回网页内容的长度

代码如下：

import requests
def getHTMLText(url):
    try: 
        for i in range(0,20):                   #访问20次
            r = requests.get(url, timeout=30)
        r.raise_for_status() #如果状态不是200，引发异常
        r.encoding = 'utf-8' #无论原来用什么编码，都改成utf-8
        return r.status_code,r.text,r.content,len(r.text),len(r.content)  ##返回状态，text和content内容，text（）

最低0.47元/天解锁文章

baihuan5059

关注

1
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
python之初学爬虫并且将爬回来的数据存为csv文件

一、开发工具：运行环境： python3.7 win10python 第三方库： requests (自行安装） >>> cmd --->pip install requests, 具体不做介绍)二、检测是否安装成功在命令行中输入python，敲击回车，进入python环境。再输入以下指令并回车：　...
复制链接

扫一扫