python
荏苒相忆
这个作者很懒,什么都没留下…
展开
-
python3 爬虫html之数据解析(bs4,lxml-xpath)
html解析大法-bs4from bs4 import BeautifulSouphtml_doc = """<html><head><title>The Dormouse's story</title></head><body><p class="title"&am转载 2019-03-16 09:46:09 · 764 阅读 · 0 评论 -
静态网页 爬虫实战(二)
以抽屉网为例,爬取该用户评论,并存入MongoDB数据库"""链接mongoDB后,导入数据"""import requestsimport urllibimport refrom bs4 import BeautifulSoupimport pymongoimport timefrom datetime import datetime,timedelta原创 2019-03-16 09:54:27 · 219 阅读 · 0 评论 -
静态网页 爬虫实战(一)
以抽屉网为例,爬取该用户评论import requestsimport urllibimport refrom bs4 import BeautifulSoup#通过循环实现对不同页码的网页的数据爬取for page in range(3):#以3页为例 url = 'https://dig.chouti.com/user/cocolary/comments/'+str(...原创 2019-03-13 11:54:08 · 301 阅读 · 0 评论