# -*- coding:utf8 -*-
from bs4 import BeautifulSoup
import requests
url = 'http://www.woshipm.com' #写明我们要抓取的网页;
web_data = requests.get(url) #web_data为变量名,用requests库中的get来抓取这个网页的信息;
soup = BeautifulSoup(web_data.text,'lxml') #soup是变量名。调用BeautifulSoup和lxml库解释网页,其中web_data.text是我们要获取的网页文本信息
titles = soup.select('div.stream-list-content > h2 > a') #使用select写明titles具体位置,括号内的内容为标题位置,位置获取方法
#通过打开网页—审查元素—找到标题对应位置的代码—选择【copy】—【copy selector】
pageviews = soup.select(' span.post-views')
imgs = soup.select(' div.stream-list-image > a > img')
for title,pageview,img in zip(titles,pageviews,imgs):
data = {
'title':title.get_text(),
'pageview':pageview.get_text(),
'img':img.get('src'