python + selenium爬取品牌信息

最新推荐文章于 2024-04-01 15:31:43 发布

weixin_39159012

最新推荐文章于 2024-04-01 15:31:43 发布

阅读量280

点赞数

分类专栏：爬虫文章标签：爬虫 python selenium

本文链接：https://blog.csdn.net/weixin_39159012/article/details/100702910

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

学习爬虫，走了很多弯路，记录下python+selenium的测试，直接上代码

#encoding=utf-8
from selenium.webdriver import Chrome
from bs4 import BeautifulSoup 
driver = Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe")
"""
环境要求：
1. pip install selenium
2.需要将chromedriver.exe放在driver所指路径，下载时要与本地chrome版本匹配或更新，具体版本查看chrome
下载地址：http://npm.taobao.org/mirrors/chromedriver/

"""
# 加载URL网页

def grabBrands(url):
    goodsname = []
  
    try:
        driver.get(url)
        element =  driver.find_elements_by_xpath("//*[@id='J_selector']/div[1]/div/div[3]/a[1]")  #找到品牌更多btn
        element[0].click() #模拟鼠标点击更多
        page = driver.page_source
        soup = BeautifulSoup(page,'html.parser')
        data1 = soup.find('ul',{"class":"J_valueList v-fixed"})
        datali =data1.find_all('li')    
        for i in datali:
            goodsname.append(i.a.attrs['title'])
        assert "No results found." not in driver.page_source
    except Exception as ex:
        
    # 关闭当前标签，也可以使用quit()关闭浏览器
        driver.close()
        return None
    return goodsname

if __name__=="__main__":
    good = input("请输入商品名称：")
    url = 'https://search.jd.com/Search?keyword='+ str(good)+ '&enc=utf-8' 
    print(grabBrands(url))

weixin_39159012

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python + selenium爬取品牌信息

学习爬虫，走了很多弯路，记录下python+selenium的测试，直接上代码#encoding=utf-8from selenium.webdriver import Chromefrom bs4 import BeautifulSoup driver = Chrome("C:\Program Files (x86)\Google\Chrome\Application\chromedri...
复制链接

扫一扫

专栏目录