selenium爬取淘宝信息

#coding:utf-8
#__author__='wang'

import time
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('https://www.taobao.com/')

#获取输入框,输入笔记本电脑
driver.find_element_by_id('q').send_keys(u'笔记本电脑')

#定位搜索按钮
driver.find_element_by_class_name('btn-search').click()

#循环爬取页面商品信息
for page in xrange(1,5):
    print '正在获取第{}页数据'.format(page)

    #定期将滚动条进行向上滚动
    # (1, 11, 2):从1开始循环数值每隔两次开始循环一次
    for x in xrange(1,11,2):
        #根据x循环的值来计算我们循环的比例
        i = float(x)/10
        print 'i == ',i
        #documemt.documentElement.scrollTop:每次滚动距离最上端的高度
        #document.documentElement.scrollHeight:获取可滚动页面的整体高度
        js = "document.documentElement.scrollTop =
 document.documentElement.scrollHeight * %f" % i

        driver.execute_script(js)

        #浏览器每滚动一次休眠一下让后面的代码下载商品信息
        time.sleep(3)

    #获取包含商品信息的div
    shops_list = driver.find_elements_by_class_name('grid-item')
    for one_shop in shops_list:
        with open('shop.txt','a') as f:
            f.write(one_shop.text.encode('utf-8'))
            f.write('\n')


    #获取下一页
    driver.find_element_by_link_text('下一页').click()
print '数据爬取完毕'
driver.quit()



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值