Task Two. 爬虫学习

2.1 beautiful库入门

1. beautfulsoup基础知识
2. 使用beautifulsoup解析HTML页面
	* beautiful soup 是一个HTML/XML解析器
	* 原理:基于DOM,载入整个文档作解析。
	* 优点: - 解析HTML非常简单,API人性化,支持(css选择器,标准库中的解析器以及lxml中的XML解析器)
	* 缺点:因为要载入整个文档,所以时间和内存开销会比较大。定位到关键资源的效率不如正则表达式和XPATH,一般不推荐使用
	
3. 操作beautiful soup
	库的主要功能是解析,遍历,维护DOM(标签树)
    soup = BeautifulSoup(html, 'parser ')
	BeautifulSoup基本元素:比如 <a>
		* Tag 标签  soup.a
		*  Name 标签名 soup.a.name
		* Attributes标签的属性 soup.a.attrs
		* NavigableString 标签内非属性字符串 soup.string
		* Comment 标签内字符串的注释部分
	method .prettify()给文本加入\n,使得html的文本内容更有层次感。也可用于标签的输出。
	BS默认将html转成utf-8编码
4. 基于bs4库的HTML内容遍历方法
	DOM是一颗结点树。那么结点之间就有层级关系。
	+ 从顶点向下遍历的方法:
		- .contents 将标签下所有的子节点都存入一张列表
		- .children 迭代器
		- .descendants 迭代器
	+ 从结点向上:
		- .partent 将标签的父节点存入一张列表
		- .parents 迭代器
	+ 平级:
		- .next_sibling
		- previous_sibling


## 爬取高校数据
from bs4 import BeautifulSoup as bs
import requests

url = ""
re = requests.get(url)
re.encoding = "utf-8"
html = re.text

soup = bs(html,"html.parser")
print(soup.prettify())

top_nodes = soup.find_all("tr","alt")
rank={}
for node in top_nodes:
	tmp = node.contents
	rank.update({"排名":tmp[0], "学校名称":tmp[1], "总分":tmp[3]})
基于SSM框架的智能家政保洁预约系统,是一个旨在提高家政保洁服务预约效率和管理水平的平台。该系统通过集成现代信息技术,为家政公司、家政服务人员和消费者提供了一个便捷的在线预约和管理系统。 系统的主要功能包括: 1. **用户管理**:允许消费者注册、登录,并管理他们的个人资料和预约历史。 2. **家政人员管理**:家政服务人员可以注册并更新自己的个人信息、服务类别和服务时间。 3. **服务预约**:消费者可以浏览不同的家政服务选项,选择合适的服务人员,并在线预约服务。 4. **订单管理**:系统支持订单的创建、跟踪和管理,包括订单的确认、完成和评价。 5. **评价系统**:消费者可以在家政服务完成后对服务进行评价,帮助提高服务质量和透明度。 6. **后台管理**:管理员可以管理用户、家政人员信息、服务类别、预约订单以及处理用户反馈。 系统采用Java语言开发,使用MySQL数据库进行数据存储,通过B/S架构实现用户与服务的在线交互。系统设计考虑了不同用户角色的需求,包括管理员、家政服务人员和普通用户,每个角色都有相应的权限和功能。此外,系统还采用了软件组件化、精化体系结构、分离逻辑和数据等方法,以便于未来的系统升级和维护。 智能家政保洁预约系统通过提供一个集中的平台,不仅方便了消费者的预约和管理,也为家政服务人员提供了一个展示和推广自己服务的机会。同时,系统的后台管理功能为家政公司提供了强大的数据支持和决策辅助,有助于提高服务质量和管理效率。该系统的设计与实现,标志着家政保洁服务向现代化和网络化的转型,为管理决策和控制提供保障,是行业发展中的重要里程碑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值