day1-requests的使用

这篇博客介绍了HTML的基础知识,包括常用的标签如head、body、meta、title、link、img、a等,并展示了表单相关元素如input、textarea、select、option等。此外,还讲解了如何使用Python的requests库获取网页内容并进行简单的正则表达式匹配操作。
摘要由CSDN通过智能技术生成

html基础

  • 常用标签
<!DOCTYPE html> 
<!-- 
!DOCTYPE  - 版本说明
-->
<!-- 
html基本结构
 head - 头部
 body - 内容
 -->
 
 <!-- 
	标签语法:单标签和双标签
	<标签名></标签名>
	<标签名 />    <标签名>
  -->
<html>
	<head>
		<!-- 设置编码方式 -->
		<meta charset="utf-8" />
		<!-- 设置网页标题 -->
		<title>网页标题</title>
		<!-- 设置网页图标 -->
		<!-- 
		link 导入外部文件 
		rel 设置导入文件的作用 icon- 图标 stylesheet-样式表
		type 设置被导入的文件的类型:文件类型/文件后缀   image/png  
		href - 被导入的文件路径
		-->
		<link rel="icon" type="image/png" href="./img/01.png" />
	</head>
	<body>
		<h1>hello world</h1>
		<p>这是一个段落</p>
		<span>行内文字1<span>
		<span>行内文字2<span>
		<!-- 
			br  换行 
			&nbsp;  空格 (一个像素)
			&emsp;  空格 (一个空格)
		-->
		<p>
			这是一个段落<br>  
			这是一个段落&nbsp;&emsp;
		</p>
		<p>这是一个段落&nbsp;&emsp;</p>
		<p><b>段落</b></p>
		<!-- 
			加粗: b / strong
			斜体 : i /
		 --> 
		 <p><i>段落</i></p>
            
         <!-- 图片标签 -->
		<img src="img/02.png" />
		<img src="img/01.png" title="鼠标悬停时显示的文字" alt="图片加载失败的时候显示的文字">
		
		<!-- target _self 再当前页面显示新的页面 / _blank在新的窗口显示 -->
		<a href="https://www.baidu.com" target="_blank">百度</a>
		<br>
		<a href="https://www.baidu.com">
			百度
			<img src="img/01.png" />
		</a>
	</body>
</html>

  • 表单相关标签
<!DOCTYPE html>
<html>
	<head>
		<meta charset="utf-8">
		<title>表单标签</title>
	</head>
	<body>
		<!-- 表单标签 -->
		<!-- 用来对表单中相关标签进行重置和提交,单独使用无价值 -->
		<form action="" method="post">

			<!-- 表单相关标签 -->
			<!-- 2.1 input 标签 
			type  默认text  普通文本输入框
			-->
			普通文本输入框:<input type="text" name="" id="username" value="" placeholder="请输入姓名" /><br />
			<!-- 
				value属性 - 输入框中的内容
				placeholder - 输入提示信息
			 -->

			密码输入框:<input type="password" name="" placeholder="请输入密码" /><br />

			<!-- 
			单选按钮需要通过label标签来提供选项,当label的for和input的id一直,点击label可以选中input
			如果希望选项中有且只有一个选项处于选中状态,需要将多个选项的name属性设置成相同的值
			 -->
			单选按钮:<input type="radio" name="sex" id="sex1" value="" checked="checked" /><label for="sex1"></label>
			<input type="radio" name="sex" id="sex2" value="" /><label for="sex2"></label><br>



			复选按钮:<input type="checkbox" name="" id="ball1" value="" /><label for="ball1">篮球</label>
			<input type="checkbox" name="" id="ball2" value="" /><label for="ball2">足球</label>
			<input type="checkbox" name="" id="ball3" value="" /><label for="ball3">羽毛球</label>

			<br>
			普通按钮:<input type="button" name="" id="" value="普通按钮" /><br>

			<!-- 重置同一个form标签里的内容 -->
			重置按钮:<input type="reset" name="" id="" value="重置" /><br>



			颜色选择器:<input type="color" name="" id="" value="" /><br>
			文件选择:<input type="file" name="" id="" value="" /><br>
			时间选择:<input type="time" name="" id="" value="" /><br>
			日期选择:<input type="date" name="" id="" value="" /><br>
			本地日期时间选择:<input type="datetime-local" name="" id="" value="" /><br>

		</form>
        
        
        <!-- 多行文本输入框 -->
		<textarea rows="20" cols="600" placeholder="请输入评论内容" ></textarea>
		
		<!-- 下拉列表 -->
		城市选择:<select name="city">
			<option value="成都市">成都市</option>
			<option value="达州市">达州市</option>
			<option value="南充市">南充市</option>
			<option value="巴中市">绵阳市</option>
			<option value="攀枝花">攀枝花</option>
		</select>
		
		<!-- 列表 -->
		<!-- 有序列表 -->
		<ol>
			<li>Python</li>
			<li>java</li>
			<li>h5</li>
			<li>ui</li>
			<li>物联网</li>
		</ol>
		<!-- 无序列表 -->
		<ul>
			<li>Python</li>
			<li>java</li>
			<li>h5</li>
			<li>ui</li>
			<li>物联网</li>
		</ul>
		
		<!-- div标签 -->
		<div id="">
			
		</div>
	</body>
</html>

  • requests的使用

    import requests
    
    # 1.获取指定网页数据 (发送请求且返回)
    response = requests.get('https://www.sohu.com/')
    # 设置编码方式
    response.encoding = 'utf-8'
    # 2.获取请求内容
    print(response)   # <Response [200]>
    # 在请求成功的时候获取王国也源代码
    # if response.status_code == 200:
        # print(response.text)
    

作业

"""
Time:2021/5/24  16:47
Author:Spectre
"""
import requests

# 1.获取指定网页数据 (发送请求且返回)
response = requests.get('https://www.sohu.com/')
# 设置编码方式
response.encoding = 'utf-8'
# 2.获取请求内容
print(response)   # <Response [200]>
# 在请求成功的时候获取王国也源代码
# if response.status_code == 200:
    # print(response.text)

import re
from re import *
re_str = r'(?s)<div class="focus-news">.*<div class="right sidebar">'
result1 = re.findall(re_str,response.text)
# re_str2 = r'title=\"[\u4e00-\u9fa5]+\" | title=\"[\u4e00-\u9fa5]+[·、 ][\u4e00-\u9fa5]+\"'
re_str2 = r'title=.+?"'
# re_str2 = r'<a href=".*".*</a>'
result2 = re.findall(re_str2,str(result1))
print(result2)
re_str3= r'<a href=".*?"'
result3 = re.findall(re_str3,str(result1))
print(result3)

# print(len(result2))
# len(result3))
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值