Python 学习 Day 27

szxc123123

已于 2022-07-25 09:17:15 修改

阅读量150

点赞数

文章标签： python 学习 chrome

于 2022-07-24 10:36:54 首次发布

本文链接：https://blog.csdn.net/szxc123123/article/details/125956722

版权

import requests
from useragent import UserAgent
from lxml import etree

url = ‘http://www.farmer.com.cn/xwpd/rdjjl/201807/t201880722/_1393916.htm’

headers = {
‘User-Agent’: UserAgent().chrome
}

response = requests.get(url,headers=headers)
e = etree.HTML(response.text)
title = e.xpath(‘//h1/text()’)
content = e.xpath(‘string(div[@class=“content”]//p’)
img_urls = e.xpath(‘//div[@class=“content”]//img/@src’)
img_names = e.xpath(‘//div[@align=“center”’)
for img_name in img_names:
img_name =title + img_name.xpath(‘string(,)’)