xpath的使用,selenium爬取京东商品信息,scrapy介绍,安装及使用

最新推荐文章于 2023-11-26 17:19:39 发布

VIP文章 yikenaoguazi

最新推荐文章于 2023-11-26 17:19:39 发布

阅读量395

点赞数 1

分类专栏： start all over again

本文链接：https://blog.csdn.net/yikenaoguazi/article/details/113138678

版权

这里写目录标题

一.xpath的使用
二.selenium爬取京东商品信息
三.scrapy的架构
- 3.1scrapy的架构
- 3.2目录介绍
四.scrapy的简单使用

一.xpath的使用

1 css  xpath  通用的
2 XPath 使用路径表达式在 XML 文档中选取节点
3 lxml模块为例，讲xpath选择（selenium，scrapy---》css/xpath）
4 用法：

# / :从当前节点开始选择，子节点
# // ：从当前节点开始选择，子子节点
# @选取属性a[@href="image1.html"]，选择a标签，href属性为image1.html
# .. 表示父节点
# /a[3] 选当前节点下第一个a标签
# /text() 取这个标签的文本
# /@href  获取href属性
# /a[contains(@class,"li")] 类名中有li的a标签
# /a[@class='li'] 类名等于li的a标签

二.selenium爬取京东商品信息


from selenium import webdriver
from selenium.webdriver.common.keys import Keys


# 定义爬取函数

def get_goods(bro):
    # 滑倒屏幕底部
    bro.execute_script('scroll(0,document.body.scrollHeight)')
    li_list = bro.find_elements_by_class_name('gl-item')
    for li in li_list:
        try:
            img_url = li.find_element_by_css_selector('.p-img>a>img').get_attribute('src')

最低0.47元/天解锁文章

yikenaoguazi

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
xpath的使用,selenium爬取京东商品信息,scrapy介绍,安装及使用

这里写目录标题一.xpath的使用二.selenium爬取京东商品信息三.scrapy的架构3.1scrapy的架构3.2目录介绍四.scrapy的简单使用一.xpath的使用1 css xpath 通用的2 XPath 使用路径表达式在 XML 文档中选取节点3 lxml模块为例，讲xpath选择（selenium，scrapy---》css/xpath）4 用法：# / :从当前节点开始选择，子节点# // ：从当前节点开始选择，子子节点# @选取属性a[@href="image1
复制链接

扫一扫