笔记20210524前端以及requests获取网页数据

本文介绍了HTML、CSS和JavaScript的基础,展示了如何使用requests库从https://www.sohu.com/获取并解析网页数据,涵盖了关键标签如img、a、form以及input等的用法。
摘要由CSDN通过智能技术生成

前端以及requests获取网页数据

  1. html简介

    1. html——提供网页内容

      css——决定网页布局和样式

      js——负责网页内容的变化

      html网页基本结构:

      整个网页就是一个html标签。(有多少个网页就有多少个标签)

      一个html标签里边有一个head标签和一个body标签

      head——负责网页头部的显示

      body——负责网页内容的显示

      link——用来导入外部文件

      rel设置导入文件的作用,icon—图标,stylesheet—样式表

      type——设置被导入的文件的类型和格式,文件类型/后缀,image/jpg—表示导入的文 件是图片,后缀是jpg

      href——被导入文件的路径

      h标签——标题:h1~h6六级标题

      p标签——段落:一个段落一个p标签

      span、font——普通文字

      br标签——强制换行

      &nbsp和&emsp——空格(一个像素和一个空格)

      b/strong标签——加粗

      i 标签——倾斜标签

      标签语法:

      标签分为单标签和双标签

      双标签:<标签名 属性名1=“值1” 属性名2=“值2”>标签内容</标签名>

      单标签:<标签名/> 或者 <标签>

      注意:

      ​ 1、双标签的内容可以是文字也可以是其他标签,如

      ​ 2、html是通过不同的标签来给网页提供不同的内容

  2. 常用标签

    1. 图片:img标签

      src——图片地址

      title——图片标题(自定义,鼠标放在图片上自动显示)

      alt——图片加载失败时的提示信息

    2. 超链接:a标签

      可见内容

      href——跳转地址

      target——跳转方式,默认值是_self(在当前页面内显示新的页面),_blank(在空白页面 中显示新的页面)

  3. 表单标签

    1. 表单标签(form标签)

      用来对表单中相关标题标签进行重置和提交,但单独使用就没有任何作用

    2. 表单相关标签1

      1. input标签

        type属性——值不同,标签的表现和值完全不同

        value属性——输入框中的内容

        placeholder属性——提示信息

        maxlength属性——输入框中最大长度

        type=“text”——文本框

        type=“button”——普通按钮

        type=“password”——密码框

        type=“radio”——单选按钮

        type=“checkbox”——复选按钮

        type=“reset”——重置按钮(将需要重置的内容包括在form标签中)

        type=“color”——颜色选择器

        type=“file”——文件选择

        type=“datetime-local”——时间选择器

        type=“image”——图片选择器

    3. 表单相关标签2

      1. 多行文本输入框——textarea标签

        下拉列表——select标签

      2. 列表

        有序列表——ol标签

        无序列表——ul标签

      3. div

        无实际意义,只是进行分类和分组

    4. requests的基本使用

      import requests
      # 1.获取指定网页的数据,并返回结果
      response = requests.get('https://www.sohu.com/')
      # 设置编码方式
      response.encoding = 'utf-8'
      
      # 2.获取请求内容
      print(response)
      
      # 在请求成功的时候获取网页源代码(网页内容)
      if response.status_code == 200:
          print(response.text)
      
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值