通过前面三天的学习。我们现在应该对爬虫有所了解。接下来,我们将从几个项目实战来练手。
回顾爬取淘宝商品页面——通过驱动来实现
def search_product(key):
driver.find_element_by_id('q').send_keys(key)
driver.find_element_by_class_name('btn-search').click()
def get_product():
divs=driver.find_elements_by_xpath('//div[@class="items"]/div[@class="item J_MouserOnverReq "]')
for div in divs:
info=div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text #商品的名称
price = div.find_element_by_xpath('.//strong').text + "元" #商品的价格
deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text #付款人数
name = div.find_element_by_xpath('.//div[@class="shop"]/a').text #店铺名字
print(info,price,deal,name,sep='|')
def main():
search_product('机器学习实战'