前端以及requests获取网页数据
-
html简介
-
html——提供网页内容
css——决定网页布局和样式
js——负责网页内容的变化
html网页基本结构:
整个网页就是一个html标签。(有多少个网页就有多少个标签)
一个html标签里边有一个head标签和一个body标签
head——负责网页头部的显示
body——负责网页内容的显示
link——用来导入外部文件
rel设置导入文件的作用,icon—图标,stylesheet—样式表
type——设置被导入的文件的类型和格式,文件类型/后缀,image/jpg—表示导入的文 件是图片,后缀是jpg
href——被导入文件的路径
h标签——标题:h1~h6六级标题
p标签——段落:一个段落一个p标签
span、font——普通文字
br标签——强制换行
 和&emsp——空格(一个像素和一个空格)
b/strong标签——加粗
i 标签——倾斜标签
标签语法:
标签分为单标签和双标签
双标签:<标签名 属性名1=“值1” 属性名2=“值2”>标签内容</标签名>
单标签:<标签名/> 或者 <标签>
注意:
1、双标签的内容可以是文字也可以是其他标签,如
2、html是通过不同的标签来给网页提供不同的内容
-
-
常用标签
-
图片:img标签
src——图片地址
title——图片标题(自定义,鼠标放在图片上自动显示)
alt——图片加载失败时的提示信息
-
超链接:a标签
href——跳转地址
target——跳转方式,默认值是_self(在当前页面内显示新的页面),_blank(在空白页面 中显示新的页面)
-
-
表单标签
-
表单标签(form标签)
用来对表单中相关标题标签进行重置和提交,但单独使用就没有任何作用
-
表单相关标签1
-
input标签
type属性——值不同,标签的表现和值完全不同
value属性——输入框中的内容
placeholder属性——提示信息
maxlength属性——输入框中最大长度
type=“text”——文本框
type=“button”——普通按钮
type=“password”——密码框
type=“radio”——单选按钮
type=“checkbox”——复选按钮
type=“reset”——重置按钮(将需要重置的内容包括在form标签中)
type=“color”——颜色选择器
type=“file”——文件选择
type=“datetime-local”——时间选择器
type=“image”——图片选择器
-
-
表单相关标签2
-
多行文本输入框——textarea标签
下拉列表——select标签
-
列表
有序列表——ol标签
无序列表——ul标签
-
div
无实际意义,只是进行分类和分组
-
-
requests的基本使用
import requests # 1.获取指定网页的数据,并返回结果 response = requests.get('https://www.sohu.com/') # 设置编码方式 response.encoding = 'utf-8' # 2.获取请求内容 print(response) # 在请求成功的时候获取网页源代码(网页内容) if response.status_code == 200: print(response.text)
-