python网络爬虫
python网络爬虫
尘缘浮梦
这个作者很懒,什么都没留下…
展开
-
3.爬虫之xpath解析
思路,为了减少请求网站次数,可以先将网站源代码保存在一个html文件中,然后写xpath验证。自己的xpath写的是否正确。原创 2023-06-27 11:31:17 · 581 阅读 · 1 评论 -
2.爬虫之正则表达式
Regular Expression,正则表达式是一种对字符串进行匹配的语法规则。优点:速度快,效率高,准确性高。爬虫时用来提取页面内容数据。这两个要着重的说一下. 因为我们写爬虫用的最多的就是这个惰性匹 配。用来测试正则表达式是否正确。原创 2023-06-20 15:18:13 · 518 阅读 · 0 评论 -
1.爬虫之requests模块
requests是一款功能强大,同步的框架。主要用于网络爬虫。原创 2023-06-20 14:29:55 · 530 阅读 · 0 评论 -
0.爬虫是否合法
爬虫本身不违法,将爬取的数据用于非法途径违法。原创 2023-06-20 16:06:34 · 875 阅读 · 0 评论