爬取国外名人名言的内容作者和标签(标签只选择第一个)

 结果

 

 代码

import requests
from lxml import etree
'''获取网页源代码'''
try:
    r = requests.get('http://quotes.toscrape.com/page/1/')
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    html = r.text
except:
    print('出现错误')
html1 = etree.HTML(html)
wenben = html1.xpath('//div[@class="quote"]/span[1]/text()')
zuoze = html1.xpath('//div/span[2]/small/text()')
#tags = html1.xpath('//div[@class="quote"]//div[@class="tags"]/a/text()')
tags=html1.xpath('//div[@class="quote"]//div[@class="tags"]/a[1]/text()')
#tags=html1.xpath('/html/body/div/div[2]/div[1]/div[1]/div/text()')
#print(wenben) 打印列表
#print(zuoze)  打印列表
#print(tags)   打印列表
if len(wenben)==len(zuoze):
    print('对的')
print(len(wenben))
ulist=[]
for i in range(len(wenben)):
    ulist.append([wenben[i],zuoze[i],tags[i]])
print(ulist)

print('{0:<130}\t{1:^20}{2:^8}'.format('名言','作者','标签'),chr(12288))
for i in ulist:
    print('{0:<130}\t{1:^20}{2:^8}'.format(i[0],i[1],i[2]),chr(12288))

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值