Python
QINGMU150
这个作者很懒,什么都没留下…
展开
-
新闻网站爬虫(Python2.7)
针对各种类型新闻网站,包含动态加载网页,无需分析URL的爬虫方法。代码中包含环球网、中新网、新华网新闻内容爬取,包含通过自动填充关键词爬取新闻内容,也包括指定从某一网页开始爬取后续网页。一、非动态加载网页的爬取 (1)通过分析URL信息,拼接URL获取将要爬取的网站,例如:url = 'http://s.huanqiu.com/' + 's?q=' + s_keyword + ...原创 2019-01-07 21:48:47 · 1302 阅读 · 0 评论 -
BeautifulSoup的安装与使用
一、Beautifulsoup的安装 beautifulsoup属于bs4工具包,因此只需要安装bs4即可使用beautifulsoup,在控制台输入 pip install bs4二、解析网页(1)不指定解析类型 自动选择最合适的解析器解析文档>>>from bs4 import BeautifulSoup>...原创 2019-01-13 16:59:50 · 586 阅读 · 0 评论