python爬虫
文章平均质量分 72
当归67
这个作者很懒,什么都没留下…
展开
-
Python爬虫之xpath的使用
一、简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。二、安装 pip install lxml 三、使用 1、导入 from lxml import etree 2、基本使用 from lxml import...原创 2021-09-02 22:08:33 · 123 阅读 · 0 评论 -
关于如何成为一名爬虫工程师
如何成为一名爬虫工程师 一、爬虫工程师是干嘛的? 1.主要工作内容? 互联网是由一个一个的超链接组成的,从一个网页的链接可以跳到另一个网页,在新的网页里,又有很多链接。理论上讲,从任何一个网页开始,不断点开链接、链接的网页的链接,就可以走遍整个互联网!这个过程是不是像蜘蛛沿着网一样爬?这也是“爬虫”名字的由来。 作为爬虫工程师,就是要写出一些能够沿着网爬的”蜘蛛“程序,保存下来获得的信息。一般来说,需要爬出来的信息都是结构化的,如果不是结构化的,那么也就没什么意义了(百分之八十的数据是非结构化的)。原创 2021-08-22 13:26:13 · 380 阅读 · 1 评论