- 博客(3)
- 收藏
- 关注
原创 爬取百度网页html5源代码(附上SyntaxError: Non-UTF-8 code starting with '\xb6'解决办法)
首先用浏览器打开网页,利用扩展程序 “fiddler” 代理获取网页。 其次输入以下代码块,爬取百度搜索目标网站的源代码: # 导入模块包 from urllib.request import Request, urlopen from urllib.parse import quote # 网址地址(采用格式化减少有效地址长度) url = "http://baidu.com/s?wd={}"...
2019-10-25 15:45:46
481
原创 编写第一个网络爬虫程序
初学python时遭遇了各种各样的问题和困难,特此记录下个人学习的艰辛历程,希望能给遇到同自己相同问题的朋友提供轻薄的借鉴。
2019-10-14 13:14:05
640
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人