文档地址:http://html.python-requests.org/
试着爬取了《伯乐在线》:http://python.jobbole.com/all-posts/ (得罪得罪!)就爬一页,试试好用不!
具体怎么使用看文档吧,或者GitHub找!
代码如下:
from requests_html import HTMLSession
from datetime import datetime
def HtmlDownloader(url):
try:
if url is None:
return
session = HTMLSession()
r = session.get(url)
Python爬虫实战:Requests-HTML库初体验

本文介绍了使用Requests-HTML库进行Python爬虫的初步尝试,通过爬取《伯乐在线》网站的页面来展示其易用性。详细操作和更多功能建议查阅官方文档或GitHub项目。
最低0.47元/天 解锁文章
1580

被折叠的 条评论
为什么被折叠?



