自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Ω

  • 博客(8)
  • 收藏
  • 关注

原创 【Python 爬虫基础】正则表达式

计算机科学领域有个笑话:“如果你有一个问题打算用正则表达式来解决,那么就是两个问题了。然而,正则表达式(通常简写 regex)经常被嘲笑是一堆随机符号混杂在一起,看起来毫无意义。这种印象让人们对其避而远之,然后费尽心思写一堆复杂的查找和过滤函数,其实他们真正需要的就是一行正则表达式。其实正则表达式上手一点也不难,而且运行很快,通过一些简单的例子就可以轻松地学会。

2024-04-13 19:36:40 626 1

原创 【Python 爬虫基础】标签解析树的导航

find_all 函数通过标签的名称和属性来查找标签。但是如果你需要通过标签在文档中的位置来查找标签,该怎么办?这就是导航树(navigating trees)的作用。现在我们用虚拟的作为要抓取的示例网页,演示 HTML 导航树的纵向和横向导航(如图)。

2024-04-03 20:28:44 886 1

原创 【Python 爬虫基础】再端一碗 BeautifulSoup

在里,我们快速演示了 BeautifulSoup 的安装与运行过程,同时也实现了每次选择一个对象的解析方法。这一章将介绍通过属性查找标签的方法,标签组的使用。基本上,你遇到的每个网站都有层叠样式表(cascading style sheet, CSS)。虽然你可能会认为,专门为了让浏览器和人类可以理解网站内容而设计一个展现样式的层,是一件愚蠢的事,但是 CSS 的发明却是网络爬虫的福音。CSS 可以让 HTML 元素呈现出差异化,使那些具有完全相同修饰的元素呈现出不同的样式。

2024-03-31 10:15:18 933 1

原创 【Python 爬虫基础】BeautifulSoup

BeautifulSoup 尝试化平淡为神奇。它通过定位 HTML 标签来格式化和组织复杂的网页信息,用简单易用的 Python 对象为我们展现 XML 结构信息。

2024-03-29 00:20:16 1167 1

原创 【Python 爬虫基础】初见 Python 网络爬虫

如果你上网的唯一方式就是用浏览器,那么你其实错过了很多种可能。虽然浏览器可以更方便地执行 Javascript、显示图片,并且可以以更适合人类阅读的形式展示数据,但是网络爬虫收集和处理大量数据的能力更为卓越。不像狭窄的显示器窗口一次只能让你看一个网页,网络爬虫可以让你一次查看几千甚至几百万个网页。

2024-03-27 23:37:05 1079

原创 【MySQL】macOS/Windows 系统 MySQL 的下载及安装详细教程

如果你是用的是macOS系统,请先下载对应的会看到如下所示的界面:这里选择macOS:选择前两个安装包:点击会出现以下界面:需要登录网站或者创建一个账户,我们这里点击最底下的跳过登录,开始下载文件。下载完文件后打开安装包,你会看到一个简易的安装向导,采用默认安装步骤即可。

2024-03-24 18:31:11 627

原创 VMware Workstation 17 Pro下载与安装

第一次打开会要求你输入购买的许可证,大家可以百度一下就行了。安装位置可根据情况自行更改。

2023-08-25 13:22:13 671

原创 【扫雷】Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量

在这个游戏中,玩家可以自定义行数、列数和地雷数量,然后输入方格的横纵坐标,并尝试找到所有的地雷。如果玩家点击到地雷,游戏将结束。如果玩家找到了所有地雷,游戏也将结束。游戏结束后,程序会询问玩家是否再玩一局游戏。

2023-08-01 10:06:14 278 1

简单的库存管理系统脚本

这个脚本允许用户添加商品,更新库存,并查看当前库存状态。这个脚本提供了一个基本的命令行界面,让用户可以查看当前库存、增加库存商品及其数量,并将库存数据保存到一个JSON文件中以便下次使用。对于小型商店或个人商贩来说,这个脚本有助于快速浏览商品情况,并作出相应的业务决策,从而保证库存的准确性。 在部署此脚本之前,请确保您已拥有JSON库(Python标准库中已包含,所以无需额外安装)。此外,您也可以根据需要调整代码,增加更多功能,比如删除商品、设置库存警报等。

2024-03-24

爬取网站上的标题,并将它们保存到一个文本文件中 轻松获取网站上的标题信息并进行进一步的分析

此脚本会把http://example.com(你需要替换为你想爬取的网站URL)中的所有标题标签里的文本抓取出来,并保存到当前目录下的titles.txt文件中。在运行脚本之前,请确保已经安装了requests和beautifulsoup4这两个库。 使用此脚本之前,请确认你有权获取网页内容,并且你的行为符合robots.txt文件和网站的使用条款。此外,过于频繁地访问网站可能会被视作滥用行为,因此务必注意请求的频率和方式。

2024-03-24

Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量

在这个游戏中,玩家可以自定义行数、列数和地雷数量,然后输入方格的横纵坐标,并尝试找到所有的地雷。如果玩家点击到地雷,游戏将结束。如果玩家找到了所有地雷,游戏也将结束。游戏结束后,程序会询问玩家是否再玩一局游戏。

2024-03-19

Matlab 常用函数汇总

Matlab 常用函数汇总,包括基本函数、三角函数相关、向量矩阵操作相关、解方程、符号表达式相关等

2023-08-25

Python实现扫雷游戏,玩家可自定义雷区大小和地雷数量

在这个游戏中,玩家可以自定义行数、列数和地雷数量,然后输入方格的横纵坐标,并尝试找到所有的地雷。如果玩家点击到地雷,游戏将结束。如果玩家找到了所有地雷,游戏也将结束。游戏结束后,程序会询问玩家是否再玩一局游戏。

2023-08-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除