爬虫
RwatitFahsa
你告诉我的,我都忘了。你教会我的,我都记得。
展开
-
【Python爬虫】xpath数据解析
最近学习了xpath相关的知识,以下是学习过程中记录的笔记,喜欢的朋友可以关注公众号:苏小怪的梦呓 一、简介 1、xpath属于xml/html解析数据的一种方式, 基于元素(Element)的树形结构(Node > Element)。选择某一元素时,根据元素的路径选择,如 /html/head/title获取<title>标签。 2、安装&使用 使用lxml解析 安装:pip install lxml 导入库:from lxml import etr...原创 2020-12-02 18:44:35 · 326 阅读 · 0 评论 -
【Python爬虫】urllib的基本介绍
一、什么是urllib? urllib 是 Python内置的HTTP请求库 官方文档地址: https://docs.python.org/3/library/urllib.html 二、相关模块 urllib.request 请求模块 urllib.error 异常处理模块,包含urllib.request抛出的异常 urllib.parse url解析模块 urllib.robotparser robots.txt解析模块 三、【重点】核心的...原创 2020-11-30 19:11:54 · 153 阅读 · 0 评论