爬虫入门系列
编程之路从0到1
这个作者很懒,什么都没留下…
展开
-
第一篇:爬虫初体验
网络爬虫理论学习都是枯燥的,我们学习了初步的网络编程后,再来了解一下爬虫吧,网络爬虫可以极大增强趣味性。什么是网络爬虫?网络爬虫又称为网络机器人,按照我个人的理解,网络爬虫就是通过编程手段,实现自动化访问网页,提取网页中我们感兴趣的信息的一种程序。为什么用Python写爬虫?足够简单。Python作为一种脚本语言,语法简洁;由于网站的网页可能会定期的更新发生结构性的变化,因此...原创 2019-03-25 18:14:36 · 624 阅读 · 0 评论 -
第二篇 HTML元素的解析
Requests 库这是一个网络请求库,主要的作用是可以模仿浏览器,发送网络请求,下载网页源码等。上一篇已经讲了如何安装,不再赘述。简单用法# 导入import requests# 发起get请求resp = requests.get('https://github.com/timeline.json')# 可通过text获取网页源码,返回的是字符串类型print(resp....原创 2019-04-02 12:31:31 · 473 阅读 · 0 评论