一、爬取淘宝信息
注意:只爬取了一页数据
代码如下:
#淘宝商品信息
#引入 selenium 中的webdriver
#1.创建firefox浏览器对象
from selenium import webdriver
import time
class TB(object):
def __init__(self,keyword):
self.keyword = keyword
def start_taobao(self):
#创建浏览器对象
driver =webdriver.Firefox()
#打开淘宝网址
driver.get('http://www.taobao.com')
#通过id找到输入框
search_input = driver.find_element_by_id('q')
#输入要搜索的关键词
search_input.send_keys(self.keyword)
#利用class来找到搜索按钮
search_btn = driver.find_element_by_class_name('btn-search')
#点击搜索按钮
search_btn.click()
time.sleep(2)
#打开文件
file_handle = open('%s.txt'%self.keyword,'w',encoding='utf-8')
for x in range(1,2):
print('正在获取第%s页数据,请稍后。。。。'%x)
#for 循环执行五次