爬虫实战
米儿~
这个作者很懒,什么都没留下…
展开
-
python2.x与python3.x的Urllib库的转换
升级合并后,模块中包的位置变化的地方较多。在此,我们总结并为大家列举一些常见的位置变动,方便之前用Python2.X的朋友在使用Python3.X的时候可以快速掌握,其他的我们在用到时具体为大家讲解。 常见的变化有: 在Python2.X中使用import urllib2---------对应的,在Python3.X中会使用import urllib.request, urlib.error。 在Python2.X中使用import urlib---------对应的,在Python3.X中会使用impo原创 2020-10-30 08:54:14 · 317 阅读 · 0 评论 -
爬虫项目实战(二)
1、XPath介绍 XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。最初是用来搜寻XML文档的,但同样适用于HTML文档的搜索。所以在做爬虫时完全可以使用XPath做相应的信息抽取。 2、XPath的常用规则: 这里列出了XPath的常用匹配规则,示例如下: .//title[@lang='eng‘],这是一个XPath规则,代表的是选择所有名称为title,同时属性lang的值为eng的节点,后面会通过Python的lxml库,利用XPath.原创 2020-06-25 23:21:22 · 395 阅读 · 0 评论 -
爬虫项目实战(一)
大纲: 一、爬虫介绍 二、网络请求requests 1、requests库的基本使用 2、GET&POST 查看电脑当前的python版本在cmd 中输入命令:python -V 如果电脑中有两个python环境,例如想在python3中下载时,使用命令:pip3 install requests 即可 接下来以爬取古诗文网为例https://www.gushiwen.org/ 打开古诗文网址,按F12,查看源代码 而之前代码中显示是由python代码的爬虫程序原创 2020-06-15 00:23:31 · 2166 阅读 · 0 评论