爬虫
文章平均质量分 78
渌玦Leo_J
有匪君子,如切如磋,如琢如磨。
展开
-
python自动获取微信公众号最新文章
微信公众号获取思路原创 2022-07-14 18:34:30 · 6132 阅读 · 6 评论 -
Python爬虫||Xpath-以豆瓣电视剧为例
XPath——全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。所以在爬虫里就可以直接使用Xpath来进行数据获取,而且方法相较于正则表达式和bs4等要简单很多。工程中常用Python的lxml库,利用XPath进行HTML的解析。安装库pip3 install lxml导入from lxml import etreeXpath的常用规则表达式描述nodena原创 2020-07-04 13:58:22 · 1135 阅读 · 2 评论 -
Python爬虫||BeautifulSoup4库-以小猪短租为例
由于上次的文章被同学吐槽了,正则表达式过于麻烦原创 2020-06-28 16:13:33 · 398 阅读 · 2 评论 -
Python爬虫||正则表达式与re模块-以猫眼电影为例
正则表达式什么是正则表达式简单来说,就是通配符,比如word中常见的 * 和 ?,最常用的就是读取某一个文件夹中的所有文档,原创 2020-06-11 12:00:58 · 600 阅读 · 0 评论