用xpath爬取html页面

最新推荐文章于 2024-07-31 00:53:52 发布

python攻城狮999

最新推荐文章于 2024-07-31 00:53:52 发布

阅读量1.4k

点赞数

分类专栏：爬虫文章标签： xpath

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42341608/article/details/84645880

版权

#淘宝店铺详情 抓取4张图片
import requests
from bs4 import BeautifulSoup
from lxml import etree
headers = {
    "accept":"text/javascript, application/javascript, application/ecmascript, application/x-ecmascript, */*; q=0.01",
    "x-requested-with":"XMLHttpRequest",
    "accept-encoding":"gzip, deflate, br"
}
def get_picture(shop_id):
    '''
    :param shop_id_list:接受一个店铺id
    :return: 返回一个列表,每个列表里面为该店铺的4张宝贝图片
    '''
    # print('店铺id为：',shop_id)
    # for shop_id  in shop_id_list:
    url = 'https://shop%s.taobao.com/asynSearch.htm?orderType=hotsell_desc&search=y&path=/search.htm'%shop_id
    response = requests.get(url, headers=headers)
    html = etree.HTML(response.text)
    html_data = html.xpath('//*[@class="J_TModule"]/div/div[2]/div/div[1]/ul')
    # pict_list = []
    for li in html_data:
        pic = li.xp

最低0.47元/天解锁文章

python攻城狮999

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python攻城狮999 CSDN认证博客专家 CSDN认证企业博客

码龄6年

46: 原创

10万+: 周排名

186万+: 总排名

14万+: 访问

: 等级

1403: 积分

29: 粉丝

24: 获赞

9: 评论

142: 收藏

私信

关注

热门文章

分类专栏

最新评论

爬取天猫店铺列表页的所有数据
白了白了羊: 哥啊，我的出不来表格，咋弄
使用face++接口实现人脸相似度比对
python攻城狮999: 那个看看你自己的需求，相似度越高，准确度就越高，图片最好提供清晰的正面照片，我用的这个接口人家官方文档的标准给的值就是80，他们做了大量的样本训练，他们的实验数据就是相似的达到百分之80就是同一个人，不过还是达不到百分之百的准确度，差不读97%的准确度吧
使用face++接口实现人脸相似度比对
「已注销」: 你好，想请问一下那个相似值是可以自己设置大于多少就验证成功的吗
python删除文件夹下面的所有文件
学徒。: file_data = path_data + "\\" + i 这行只对Windows下有效果，可以改成： file_data = os.path.join(path_data, i) 适配多平台环境
python删除文件夹下面的所有文件
画扇落汗: 在函数的for循环结束后加入os.remove(path_data)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。