AliceY_2025-CSDN博客

原创计算机组成原理 (考研学习总结)

准备2024年12月考研，考408~~我觉得总结，内化并输出，才表示学习到位了。根据考研大纲(2025年大纲还没发布，参考2024大纲)和王道书范围；对我来说不算做重点或难点的章节，简单概括；对我来说属于难点或重点的章节，详细记录，需要时举例说明。历年真题，页码和题号均来自王道复习指导2025版2015-2023年共考察单选题15题，涉及大题2道。2015-2023年共考察单选题6题，涉及大题1道。2015-2023年共考察单选题8题，涉及大题3道。

2025-03-28 19:28:32 1421

原创操作系统（考研学习总结）

准备2024年12月考研，考408~~我觉得总结，内化并输出，才表示学习到位了。所以总结了这门课的内容，记录的原则是：根据考研大纲(2025年大纲还没发布，参考2024大纲)和王道书范围；对我来说不算做重点或难点的章节，简单概括；对我来说属于难点或重点的章节，详细记录，需要时举例说明。历年真题，页码和题号均来自王道复习指导2025版2015-2023年共考察单选题23题，涉及大题3道。

2025-03-28 19:27:33 1616

原创数据结构 (考研学习总结)

二叉树与度为2的有序树的区别：1）度为2的有序树至少有三个节点，二叉树可以为空；2）度为2的有序树的孩子的次序是相对另一个孩子而言的，若某节点只有一个孩子，无需区分左右。而二叉树的孩子必须区分左右，即次序是有规定的。升序排列。子树数量：至多为ｍ，至少ｍ/２上取整。关键字数量：至多为ｍ -1，至少ｍ/２上取整 -1。根节点至少有2棵子树，即至少有一个关键字。所有叶节点都在同一层上，且不带信息（有的教材称之为失败节点，不算做节点，408中通常称其为最底层的终端节点）。

2025-03-28 19:25:53 548

原创线性代数考研自学笔记（考研数2）

标准二次型（标准型只含平方项的二次型。规范二次型（规范型）标准二次型的各项系数都为1，-1或0。化标准型：即把二次齐次多项式通过线性变换简化为只含平方项的形式。

2025-03-28 19:24:05 760

原创力扣刷题｜“队列“标签小节 (简单1 中等6 困难4) 思路+代码+细致注释～

“队列”标签下的题目，共计12题：简单1题中等7题，其中1856最优解是单调栈，没做；1673最优解也是单调栈，先写了一个脑筋急转弯的方法~困难4题，1825最优解是堆吧，先写了个队列的解算法，好慢啊…队列就是先进先出的数组，有的题目可以使用多种数据结构实现，纯数组，有序数组，队列，双端队列，循环队列，栈，堆等等~数据结构+算法的最优组合，才可以做出最优解~~ 不合适就不要勉强～933. 最近的请求次数 (队列数组 deque 细致注释~) &求解惑~~虽然是一道简单题，可是，问

2021-06-21 00:55:18 376

原创力扣刷题｜抽样 Random 算法小结~ (随机拒绝采样蓄水池抽样中等7 + 困难1) 思路+代码+细致注释～

文章目录382. 链表随机节点398. 随机数索引478. 在圆内随机生成点470. 用 Rand7() 实现 Rand10()528. 按权重随机选择497. 非重叠矩形中的随机点710. 黑名单中的随机数519. 随机翻转矩阵本周选择了“随机”项下的三个标签，随机 + 拒绝采样 + 蓄水池抽样，共计8题（中等7题 + 困难1题），大致分为四类，按照下表的顺序刷会比较舒服~以下按照类别和难度顺序记录了每题的思路，链接中有python3代码和细致的注释。请多指教~~382. 链表随机节点(蓄水池抽

2021-06-08 20:54:26 689

原创 Python爬虫学习笔记 (15) [中级] 动态网页处理 selenium 3 - Glidedsky爬虫基础2

更新日期: 2021.04.10本节内容：镀金的天空: http://glidedsky.com一个专供爬虫升级打怪的网站~~做了基础 1&2 部分，以下是基础 2 部分~目录1. 需求描述2. 代码3. 关于 selenium 的使用4. selenium 的其他功能 - 先不学啦1. 需求描述爬虫往往不能在一个页面里面获取全部想要的数据，需要访问大量的网页才能够完成任务。目标网站一个有1000个网页，每个页面有有12个数字，拿到每页上的数据，把这些数字求和。答案正确，即可通关。

2021-04-10 22:09:00 565 2

原创 Python爬虫学习笔记 (16) [中级] 处理简单的加密字体(&#x) - 获取某眼电影票房信息

更新日期: 2021.04.10本节学习内容：动态网页加载完毕，获得了全部的网页代码，接下来就要解析目标信息了。这个阶段的反扒措施主要有字体加密，JS代码，图片信息等等。今天先看看加密字体中最简单的一种~目录1. 目标信息 - 某眼电影票房信息2. 研究编码规律3. 解码 - 中文3. 解码 - 数字和英文4. 总结1. 目标信息 - 某眼电影票房信息网站页面上显示了票房信息(31.00亿)，代码中显示为&#x开头的一组代码。2. 研究编码规律数字： ‘&#’ 出现在

2021-04-10 15:14:44 511

原创 Python爬虫学习笔记 (14) [中级] 动态网页处理 selenium 2+ 豆瓣网电影清单 (下拉&点击加载页面)

更新日期: 2021.04.09本节学习内容：上一节练习了获取当当网图书清单，页面上没有判停的标志，使用 selenium不断的下拉滚动条继续加载，拉了 97次，终于到底了~本节操练下使用 selenium 的另一种场景，即页面下方有个按键，比如 “点击下载更多”，不断的下拉滚动条，然后点击这个按键，直到这个按键不再出现了（拉到底了），或者，已经拉到了我预定的次数（获得了足够的信息），不需要继续加载了。目录1. 采集豆瓣网电影清单2. 关于 selenium 的使用1. 采集豆瓣网电影清单代码

2021-04-09 23:50:31 398

原创 Python爬虫学习笔记 (13) [中级] 动态网页处理 selenium 1+ 当当网图书清单 (下拉滚动条加载页面)

更新日期: 2021.04.05本节学习内容：处理动态网页的利器 selenium~目录1. selenium是什么？为什么比requests慢？1. selenium是什么？为什么比requests慢？selenium是一套web测试系统，包含了测试的录制，编写和运行，以及测试的并行处理。支持多种主流浏览器。selenium被应用在爬虫中，是因为它可以模拟人的操作来驱动浏览器，完成加载动态网页所要求的点击和下拉等动作，以获取网页的完整代码。selenium驱动浏览器操作的过程是可以在网页

2021-04-06 08:12:48 390

原创 Python爬虫学习笔记 (12) [初级] 阶段总结~

更新日期: 2021.04.04二月开始学习 Python，三月开始学习爬虫，现在四月初了，基本学完了初级爬虫的内容，总结一下~~目录1. 收获2. 问题2.1 代码不规范2.2 信息不规范3. 走在通往中级爬虫的路上3.1 处理网页代码上的问题3.2 数据可视化3.2 其他1. 收获经过一个月的学习，基本可以爬取没有反扒机制的网站了~~学习了获取网页代码的 requests 库，解析代码的 bs4 库和精细解析的 re 库，存为 txt 和 Excel (通过xlwings库) 文档的方法，还尝

2021-04-04 22:00:50 168

原创 Python爬虫学习笔记 (11) [初级] 小练习爬取Eason所有歌曲歌词 & 制作词云图

更新日期: 2021.04.03本节内容：爬虫学了这么久，一直想不到想要目录1. 爬取歌曲信息1. 爬取歌曲信息爬取九库音乐网上 Eason 的歌曲清单，含歌曲名字和歌词。meixiaimport requestsfrom requests.exceptions import RequestExceptionfrom bs4 import BeautifulSoupimport reimport timeimport randomimport xlwings as xw# 获

2021-04-03 21:30:30 493 2

原创 Python爬虫学习笔记 (10) [初级] 正则 re 常用方法总结

更新日期: 2021.03.31本节内容：前面的 re 学习笔记内容源自官网文档，逐一介绍了 re 的的诸多才艺。本节将从 how to 的视角来介绍并总结常用方法清单。目录1. 分析目标信息在文档中出现的规律2. 确定查找工具 - 目标是一个还是多个？每个目标出现一次还是多次？3. 确定需匹配的字符串 - 目标信息有规律，还是 TA 的上下文有规律？4. 为需匹配的字符串设计匹配方法4.1 匹配单个字符串4.2 匹配一定数量的字符串4.3 单词边界确认 & 开头/结尾确认4.4 转义元字

2021-03-31 22:49:09 184 1

原创 Python学习笔记 - 阿里云天池Python训练营打卡（3）

打卡记录：Python学习 - 阿里云天池Python训练营打卡（1）Python学习 - 阿里云天池Python训练营打卡（2）目录1. 阿里云天池教程链接 (3)2. 函数2.1 函数的定义1. 阿里云天池教程链接 (3)阿里云天池教程(3) （点击打开链接）2. 函数2.1 函数的定义函数以def关键词开头，后接函数名和圆括号()。函数执行的代码以冒号起始，并且缩进。return [表达式] 结束函数，选择性地返回一个值给调用方。不带表达式的return相当于返回None。d

2021-03-30 21:54:36 1999

原创 Python爬虫学习笔记 (8) [初级] 将信息存储为 Excel 文件 - xlwings 库

更新日期: 2021.03.23已经学习的内容：爬取网页：掌握 requests 的常用方法。解析代码：掌握 BeautifulSoup (bs4) 和 re 的常用方法。保存信息：最简单的文件类型 txt。本节学习内容：使用 xlwings 将获取的信息存储为 Excel 文件。目录1. 为什么选择 xlwings ？2. 安装和导入3. 创建/打开文件4. 获取工作表中单元格的值5. 写入数据6. 保存文件，关闭文件和程序7. 其他功能1. 为什么选择 xlwings ？对于 t

2021-03-27 23:03:53 572 4

原创 Python爬虫学习笔记 (7) [初级] BeautifulSoup bs4 常用方法总结

更新日期: 2021.03.23已经学习的内容：爬取网页：掌握 requests 的常用方法。解析代码：掌握 BeautifulSoup (bs4) 和 re 的常用方法。保存信息：最简单的文件类型 txt。本节内容：前面的 bs4 学习笔记内容源自官网文档，逐一介绍了它的的诸多才艺。本节内容如下：bs4 解析思路及常用方法。定位目标标签召之即来~获取目标信息探囊取物~目录1. 解析思路及常用方法1.1 观察网页代码的规律1.2 常用方法2. 定位目标标签召之即来~2.

2021-03-23 23:22:27 765

原创 Python爬虫学习笔记 (6) [初级] re 和各种 bs4 解析器 - 速度测试

更新日期: 2021.03.22已经学习的内容：爬取网页：掌握 requests 的常用方法。解析代码：掌握 Beautiful Soup (bs4) 和 re 的常用方法。保存信息：最简单的文件类型 txt。本节内容：比较 bs4 和 re 解析器的解析速度。目录1. 测试目的2. 测试内容3. 测试文档及目标信息4. 比较两种 re 方法的解析速度每个 re 语句提取两个信息每个 re 语句提取一个信息, 提取两次5. 测试 bs4 在各种依赖下运行的速度1. 测试目的分析两类解

2021-03-22 23:30:20 691 1

原创 Python爬虫学习笔记 (5) [初级] 学习 re 正则解析库

更新日期: 2021.03.20已经学习的内容：获取网页：掌握 requests 的常用方法解析代码：掌握 bs4 的常用方法，初步了解 re 的使用保存信息：先用最简单的文件类型 txt本节学习内容：掌握解析库 re 的常用方法目录1. bs4 是什么？能帮我完成什么任务？1. bs4 是什么？能帮我完成什么任务？Beautiful Soup是Python的一个库。...

2021-03-21 15:26:38 327 2

原创 Python爬虫学习笔记 (4) [初级] 学习BeautifulSoup bs4 靓汤

日期:2021.03.13目录学习资料来源学习资料来源通过Python官网学习.打开官网找到Beautiful Soup (bs4)，当前最新beautifulsoup4版本是4.9.3 (Released on Oct 3, 2020). 英文版介绍是基于4.9.0，而中文版…不清楚是4.2.0还是4.4.0… 好多内容，先看下中文版，再看看英文版有什么不同吧…...

2021-03-17 23:17:37 657

原创 Python爬虫学习笔记 (3) [初级] 学习 requests

日期:2021.03.12目录学习资料GET发起请求提交参数获取网页信息获取网页中二进制编码的信息（图片，视频等）处理JSON格式内容 - 暂时不学获得页面的raw内容 - 暂时不学个性化请求头POST - 暂时不学响应状态代码响应头信息Cookies重新定向网址及其历史学习资料在Python官网学习requests打开www.python.org，找到第三方库中的requests，注意屏幕右上方的 “Latest version" 是绿色的，确保导入和学习的都是当前最新版本：requests 2.

2021-03-13 17:10:03 368

AliceTime11的博客