爬虫
eagle1024
25404210@qq.com
展开
-
大家一起学爬虫(三)
1、随机读取维基文章 from urllib.request import urlopen from bs4 import BeautifulSoup import re import datetime import random random.seed(datetime.datetime.now()) def getLinks(articleUrl): html = urlopen原创 2017-09-22 21:44:15 · 284 阅读 · 0 评论 -
大家一起学爬虫(一)
开启爬虫之路。。。原创 2017-09-19 18:09:12 · 721 阅读 · 0 评论 -
大家一起学爬虫(二)
1。查找同级子节点 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.pythonscraping.com/pages/page3.html") bsObj = BeautifulSoup(html,"lxml") # 查找同级子节点 for sibling i原创 2017-09-20 21:23:53 · 398 阅读 · 0 评论