- 博客(5)
- 问答 (1)
- 收藏
- 关注
转载 python.scrapy爬虫-xpath查询语法
xpath查询语法 1、查询标签中带有某个class属性的标签://div[@class=’c1’]即子子孙孙中标签是div且class=‘c1’的标签 。 2、 查询标签中带有某个class=‘c1’并且自定义属性name=‘alex’的标签: //div[@class=’c1’][@name=’alex’] 3、 查询某个标签的文本内容://div/span/text()
2017-10-11 13:38:43 531
转载 python网络数据采集学习范例-通过互联网采集
这个程序从http://oreilly.com 开始,然后随机地从一个外链跳到另一个外链 from urllib.request import urlopen from bs4 import BeautifulSoup import re import datetime import random pages = set() random.seed(datetime.datetime
2017-10-08 20:54:55 1060 1
转载 python网络数据学习范例-正则表达式+lambda函数
from urllib.request import urlopen from bs4 import BeautifulSoup import re html = urlopen("http://www.pythonscraping.com/pages/page3.html") bsObj = BeautifulSoup(html,"html.parser") images = bsObj.fin
2017-10-06 13:58:40 741
空空如也
Python爬虫爬取豆瓣电影
2017-10-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人