![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python︱爬虫
悟乙己
心如花木,皆向阳而生!
展开
-
python爬虫︱百度百科的requests请求、百度URL格式、网页保存、爬虫模块
1 、 百科网页请求1.1 网站解析requests与urllib.request对比:py3中主要用requests以及urllib.request两款库用来做网页内容的解析,两者的使用较多以requests为优,解析的内容会做较多的优化。 两款内容的对比:from bs4 import BeautifulSoupurl="http://finance.qq.com/gdyw...原创 2018-03-08 16:48:01 · 2499 阅读 · 0 评论 -
python︱HTML网页解析BeautifulSoup学习笔记
一、载入html页面信息一种是网站在线的网页、一种是下载下来的静态网页。1、在线网页参考《python用BeautifulSoup库简单爬虫入门+案例(爬取妹子图)》中的载入内容:import requestsfrom bs4 import BeautifulSoupheaders={'User-Agent': 'Mozilla/5.0 (Windows NT 6.3...原创 2017-10-11 15:54:40 · 9016 阅读 · 1 评论