- 博客(8)
- 收藏
- 关注
原创 【Python 爬虫基础】正则表达式
计算机科学领域有个笑话:“如果你有一个问题打算用正则表达式来解决,那么就是两个问题了。然而,正则表达式(通常简写 regex)经常被嘲笑是一堆随机符号混杂在一起,看起来毫无意义。这种印象让人们对其避而远之,然后费尽心思写一堆复杂的查找和过滤函数,其实他们真正需要的就是一行正则表达式。其实正则表达式上手一点也不难,而且运行很快,通过一些简单的例子就可以轻松地学会。
2024-04-13 19:36:40 626 1
原创 【Python 爬虫基础】标签解析树的导航
find_all 函数通过标签的名称和属性来查找标签。但是如果你需要通过标签在文档中的位置来查找标签,该怎么办?这就是导航树(navigating trees)的作用。现在我们用虚拟的作为要抓取的示例网页,演示 HTML 导航树的纵向和横向导航(如图)。
2024-04-03 20:28:44 886 1
原创 【Python 爬虫基础】再端一碗 BeautifulSoup
在里,我们快速演示了 BeautifulSoup 的安装与运行过程,同时也实现了每次选择一个对象的解析方法。这一章将介绍通过属性查找标签的方法,标签组的使用。基本上,你遇到的每个网站都有层叠样式表(cascading style sheet, CSS)。虽然你可能会认为,专门为了让浏览器和人类可以理解网站内容而设计一个展现样式的层,是一件愚蠢的事,但是 CSS 的发明却是网络爬虫的福音。CSS 可以让 HTML 元素呈现出差异化,使那些具有完全相同修饰的元素呈现出不同的样式。
2024-03-31 10:15:18 933 1
原创 【Python 爬虫基础】BeautifulSoup
BeautifulSoup 尝试化平淡为神奇。它通过定位 HTML 标签来格式化和组织复杂的网页信息,用简单易用的 Python 对象为我们展现 XML 结构信息。
2024-03-29 00:20:16 1167 1
原创 【Python 爬虫基础】初见 Python 网络爬虫
如果你上网的唯一方式就是用浏览器,那么你其实错过了很多种可能。虽然浏览器可以更方便地执行 Javascript、显示图片,并且可以以更适合人类阅读的形式展示数据,但是网络爬虫收集和处理大量数据的能力更为卓越。不像狭窄的显示器窗口一次只能让你看一个网页,网络爬虫可以让你一次查看几千甚至几百万个网页。
2024-03-27 23:37:05 1079
原创 【MySQL】macOS/Windows 系统 MySQL 的下载及安装详细教程
如果你是用的是macOS系统,请先下载对应的会看到如下所示的界面:这里选择macOS:选择前两个安装包:点击会出现以下界面:需要登录网站或者创建一个账户,我们这里点击最底下的跳过登录,开始下载文件。下载完文件后打开安装包,你会看到一个简易的安装向导,采用默认安装步骤即可。
2024-03-24 18:31:11 627
原创 VMware Workstation 17 Pro下载与安装
第一次打开会要求你输入购买的许可证,大家可以百度一下就行了。安装位置可根据情况自行更改。
2023-08-25 13:22:13 671
原创 【扫雷】Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量
在这个游戏中,玩家可以自定义行数、列数和地雷数量,然后输入方格的横纵坐标,并尝试找到所有的地雷。如果玩家点击到地雷,游戏将结束。如果玩家找到了所有地雷,游戏也将结束。游戏结束后,程序会询问玩家是否再玩一局游戏。
2023-08-01 10:06:14 278 1
简单的库存管理系统脚本
2024-03-24
爬取网站上的标题,并将它们保存到一个文本文件中 轻松获取网站上的标题信息并进行进一步的分析
2024-03-24
Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量
2024-03-19
Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量
2023-08-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人