网络爬虫、request模块

最新推荐文章于 2022-01-15 12:23:32 发布

格林黄

最新推荐文章于 2022-01-15 12:23:32 发布

阅读量199

点赞数

分类专栏： Python基础入门 python基础知识

本文链接：https://blog.csdn.net/apity123/article/details/100082780

版权

Python基础入门同时被 2 个专栏收录

41 篇文章 0 订阅

订阅专栏

python基础知识

38 篇文章 0 订阅

订阅专栏

自动抓取互联网信息的程序；

利用互联网数据进行分析、开发产品

步骤：

1.通过网络链接获取网页内容

2.对获得的网页内容进行处理

requests模块是一个简洁且简单的处理HTTP请求的工具

支持非常丰富的链接访问功能，包括URL获取，HTTP会话，Cookie记录等

requests网页请求：

get() 对应HTTP的GET方式

post() 对应HTTP的POST方式，用于传递用户数据

requests对象属性

status_code HTTP请求的返回状态，200表示链接成功，400表示失败

text HTTP相应内容的字符串形式，即url对应的页面内容。

# -*- coding:utf-8 -*-
import requests

def get_html_text(url):
    """
    返回url的文本
    :param url:
    :return:
    """
    r = requests.get(url,timeout = 30)
    #print(r.status_code)
    return r.text


def main():
    city_name = input('请输入城市拼音:')
    url = 'http://pm25.in/' + city_name
    url_text = get_html_text(url)
    #print(url_text)
    aqi = """
    <div class="span12 data">
        <div class="span1">
          <div class="value">
            """
    index = url_text.find(aqi)
    begin_index = index + len(aqi)
    end_index = begin_index +2
    aqi_val  = url_text[begin_index:end_index]
    print('空气质量为{}'.format(aqi_val))
if __name__ == '__main__':
    main()

格林黄

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
网络爬虫、request模块

自动抓取互联网信息的程序；利用互联网数据进行分析、开发产品步骤：1.通过网络链接获取网页内容2.对获得的网页内容进行处理requests模块是一个简洁且简单的处理HTTP请求的工具支持非常丰富的链接访问功能，包括URL获取，HTTP会话，Cookie记录等requests网页请求：get() 对应HTTP的GET方式post() 对应HTTP的POST方式，用...
复制链接

扫一扫