- 博客(1)
- 收藏
- 关注
原创 使用python解析HTML网页
对于一个学习网络爬虫的新手来说,解析HTML网页的时候遇到了不少困难,尝试过正则表达式的小白就能体会,使用正则表达式来筛选网页内容是有多费劲,而且总是感觉效果不太好。因此学会使用XPath表达式和lxml库就变得非常重要。然而许多书籍在介绍使用lxml库来解析HTML网页的时候,都比较粗略,如果你直接抓取百度首页作为案例来尝试,会发现第一步就迈不出去。以下是一些书籍介绍的解析HTML网页的...
2020-03-26 20:24:52 1696
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人