- 博客(4)
- 资源 (2)
- 问答 (4)
- 收藏
- 关注
原创 爬取Ajax网页
第一步,获取索引页1、页面按F12调出原代码2、按下Network --> XHR -->Preview,发现都在一个json数据集中3、刷新,观察左边有什么变化,每一行的区别,比如:4、引入requests库,获取内容字典是从header获取的,urlencode能将字典转为url索引5、构建一个完整的,可以传入参数的第二步,装入json,解析数据1、把json文件格式化,便于后面获取2、获取想要的东西,比如每页的url3、判断每个url都有东西4、解析每
2020-11-19 00:22:49 431
原创 把信息放入json模块
利用requests获取信息后,发现信息是json格式的import json,requestsres=requests.get(url)content = res.textjs = josn.load(content)#就转化成了列表/字典模式js['a']['b']#获取想要的信息
2020-11-09 22:26:40 102
原创 用bs4转后,用select定位
转为bs4对象后,用select定位soup.select(‘div’) 所有名为的元素soup.select(’#author’) 带有id属性,且id为authorsoup.select(’.notice’) 所有使用CSS class属性,且为notice的soup.select(‘div span’) 之间的soup.select(‘div>span’) 之间的,中间没有其他元素soup.select(‘input[name]’) 有一个name属性的inputso
2020-11-08 21:34:18 486
arcgis10.2破解版
2018-11-15
CityEngine2015破解版
2018-11-15
python信息获取中css选择器使用问题
2018-11-14
selenium控制浏览器,变换浏览器大小报错
2018-11-07
利用selenium自动发送测试邮件的问题
2018-11-01
requests 抓取网页信息 为什么获取不到信息?
2018-10-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人