爬虫
谢哲源
初一oier一枚
展开
-
Python爬虫基础——爬取pypi所有库
1、源介绍我们使用的是来自中国的清华大学pypi镜像https://pypi.tuna.tsinghua.edu.cn/simple打开一看,就是一个简单的HTML页面,里面有无数个链接。链接就是模块名。Requestsimport requestsa = requests.get("https://pypi.tuna.tsinghua.edu.cn/simple").text可以打印a试一下(在PyCharm打不全,就不截图了)BeautifulSoup解析import bs4b原创 2020-11-15 20:14:08 · 919 阅读 · 0 评论 -
python 制作火车时刻表
python 制作火车时刻表火车时刻表是一种方便快捷的查询火车班次信息的工具,那么,如何实现用python实现爬取这些网站的时刻表数据呢?一、访问 http://www.ip138.com/ 查询网的火车时刻表工具:http://qq.ip138.com/train/选择“列车车次查询”,并使用CHROME开发者工具,可以发现并没有有关数据的XHR包,这是我们选择用正则表达式提取数...原创 2019-12-14 20:02:04 · 2784 阅读 · 2 评论