爬虫
LS_learner
业精于勤,荒于嬉;
行成于思,毁于随。
展开
-
python调用百度API接口,使用json解析出错“json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) ”
代码如下:输入地址,返回经纬度import json from urllib.request import urlopen, quote def getlnglat(address): ak = 'xxxxxxxxxxx' # 浏览器端密钥,自己申请ak address = quote(address) # 由于本文地址变量为中文,为防止乱码,先用quote进行编码 url = 'http://api.map.baidu.com/geocoding/v3/?address=原创 2021-05-13 18:31:21 · 1202 阅读 · 3 评论 -
网络爬虫(二)——应用:北京铁路线的爬取及其绘制
上一篇文章学习了正则表达式,正则表达式在提取爬取的json信息时,非常有效。先跳过爬虫爬网络的原理,直接举例一个简单的爬取数据然后进行处理的例子:获取URL数据(北京地铁数据):http://map.amap.com/service/subway?_1469083453978&srhdata=1100_drw_beijing.jsonimport requestsimport re...原创 2020-04-17 15:22:25 · 1245 阅读 · 10 评论 -
网络爬虫(一)——正则表达式
初学网络爬虫,记录一下小白爬虫的爬行轨迹:正则表达式:(对于爬取的json格式的内容(它是字典格式的数据,但其实是一个大的字符串),我们可以使用正则表达式来进行匹配、提取想要的信息)那么什么是正则表达式呢?例如colou?r 可以匹配 color 或者 colour,? 问号代表前面的字符最多只可以出现一次(0次、或1次)。runoo+b可以匹配 runoob、runooob、runo...原创 2020-04-17 11:55:34 · 733 阅读 · 0 评论