title: 【Python】简单应用-糗事百科
type: categories
date: 2017-02-27 15:39:31
categories: Python
tags: [糗事百科]
一个抓取糗事百科内容的小程序。
# 糗事百科
from pip._vendor.distlib.compat import raw_input
from bs4 import BeautifulSoup
import requests
class Qiu:
# 获取界面数据
def getPage(self):
# 页面
input = raw_input('输入要获取内容的页面:')
myUrl = 'http://m.qiushibaike.com/hot/page/' + input
headers = {'User-Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'}
req = requests.get(myUrl, headers=headers)
# 转换成BeautifulSoup对象
soup = BeautifulSoup(req.text, "html.parser")
# 筛选出所有 class='content' 的标签,用 class_ 来替代 class
items = soup.find_all(class_='content')
for item in items:
sss = ''
# 利用stripped_strings去除空格和换行
for str in item.span.stripped_strings:
sss = sss + str
print(sss + '\n')
# 非 q键 读取下一条内容
inputContent = raw_input()
if inputContent == 'q': # 退出程序
print('退出当前页面')
break
inputContent = raw_input('输入任意键结束程序;输入 n 重新运行:')
if inputContent == 'n':
self.getPage()
print('-----程序已经退出------')
# 程序入口
qiu = Qiu()
qiu.getPage()