selenium爬取淘宝信息

最新推荐文章于 2024-07-01 12:35:25 发布

y15518325965

最新推荐文章于 2024-07-01 12:35:25 发布

阅读量324

点赞数

本文链接：https://blog.csdn.net/y15518325965/article/details/79416411

版权

#coding:utf-8
#__author__='wang'

import time
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('https://www.taobao.com/')

#获取输入框，输入笔记本电脑
driver.find_element_by_id('q').send_keys(u'笔记本电脑')

#定位搜索按钮
driver.find_element_by_class_name('btn-search').click()

#循环爬取页面商品信息
for page in xrange(1,5):
    print '正在获取第{}页数据'.format(page)

    #定期将滚动条进行向上滚动
    # (1, 11, 2):从1开始循环数值每隔两次开始循环一次
    for x in xrange(1,11,2):
        #根据x循环的值来计算我们循环的比例
        i = float(x)/10
        print 'i == ',i
        #documemt.documentElement.scrollTop:每次滚动距离最上端的高度
        #document.documentElement.scrollHeight：获取可滚动页面的整体高度
        js = "document.documentElement.scrollTop =
 document.documentElement.scrollHeight * %f" % i

        driver.execute_script(js)

        #浏览器每滚动一次休眠一下让后面的代码下载商品信息
        time.sleep(3)

    #获取包含商品信息的div
    shops_list = driver.find_elements_by_class_name('grid-item')
    for one_shop in shops_list:
        with open('shop.txt','a') as f:
            f.write(one_shop.text.encode('utf-8'))
            f.write('\n')


    #获取下一页
    driver.find_element_by_link_text('下一页').click()
print '数据爬取完毕'
driver.quit()

y15518325965

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
selenium爬取淘宝信息

#coding:utf-8#__author__='wang'import timefrom selenium import webdriverdriver = webdriver.Firefox()driver.get('https://www.taobao.com/')#获取输入框，输入笔记本电脑driver.find_element_by_id('q').send_key...
复制链接

扫一扫