- 博客(6)
- 收藏
- 关注
原创 Python的正则表达式(re库)详解(完整版)
" 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 “不匹配”。所有特殊字符(比如"]""-""^")在字符集中都失去原来的含义,如要使用可把"]""-"放在第一个字符,"^"放在非第一个字符。正则表达式,英文名称叫Regular Expression,简称RegEx,是用来匹配字符的一种工具,它常被用在网页爬虫、文稿整理、数据筛选等方面,最常用的就是用在网页爬虫,数据抓取。count:可选参数,表示模式匹配后替换的最大次数,默认值为0,表示替换所有的匹配值。
2024-07-29 14:24:37 991
原创 利用python的三种不同方式爬取《豆瓣电影TOP250》排行榜的所有电影信息
这段代码使用了lxml库的etree模块来解析HTML文档,通过XPath选择器提取所需数据。请注意,Ch模块包含了处理网络请求和文件路径的自定义功能,它包含get_web_request()方法用于发送网络请求,并且get_dir_cache_to()方法用于返回缓存目录路径。这段代码主要用于爬取豆瓣电影Top250列表中的电影详细信息,并将其存储到CSV文件中。它使用了BeautifulSoup和正则表达式来解析和提取网页中的数据。下面是带有注释的代码,解释了每个部分的功能。模块来写入CSV文件以及。
2024-06-24 19:59:02 1302
原创 windows10家庭版找不开gpedit.msc本地组策略怎么办?
2、接下来我们选择“文件” --> “另存为”,“保存类型”选择“所有文件 (*.*)”,文件名称随意,扩展名为“cmd”把它保存到桌面等任意目录下。功能限制了,所以才会打不开,而家庭版以上的版本就不会有这个问题。3、接下来在该文件上,右键。中的某些设置,但在按下。即可正常打开我们熟悉的。【本地组策略编辑器】4、运行完毕后,输入。
2024-06-17 09:40:34 2005
原创 常用的各种HTML状态码列表大全
当浏览器向 Web 服务器请求服务时,可能会发生错误,并且服务器可能会返回错误代码,例如 "404 Not Found"。通常这些错误被称为 HTML 错误消息。但是这些消息应称为 HTTP 状态消息。实际上,服务器总会为每个请求返回一条消息。最常见的消息是 200 OK。
2024-06-13 12:27:19 755
原创 Python 学习笔记
概述Python编程的核心内容与应用。从基础语法出发,涵盖变量、数据类型、条件判断、循环结构以及函数定义等关键概念。进阶部分深入探讨了模块与包管理、异常处理以及文件操作等技能。此外,还介绍了生成器、迭代器、装饰器等高级特性,提升了代码效率和优雅度。通过实践应用,将理论知识与实际操作相结合,展示了Python在Web开发、数据分析和自动化脚本编写等方面的广泛应用。
2024-06-13 11:42:07 1071
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人