爬虫创建表格以及下拉进度条

我是本着最基本的逻辑出发实现的基本逻辑

我使用的Python版本是3.7.8

首先,创建一个工作表(方法一)
import requests
import xlwt
from bs4 import BeautifulSoup
def getHtml():
    #创建工作表
    k=1
    f = xlwt.Workbook()
    sheet = f.add_sheet("北京微博签到一览")
    rowtitle = ['name','addr','content']
    for i in range(0,len(rowtitle)):
        sheet.write(0,i,rowtitle[i])

方法二

import pandas as pd 
datalist=[]
datalist.append([name,addr,content])
print(datalist)
lie = ['name','content','addr']
test = pd.DataFrame(datalist,columns=lie)
test.to_csv('./test1.csv',index=False)

2. 实现下拉进度条向下翻页
我用的谷歌浏览器版本是73.0.3683.75
selenium对应的包,
想使用则需要卸载现有谷歌浏览器,安装对应的版本

from selenium import webdriver
browser = webdriver.Chrome(chrome_options=chrome_options,executable_path=driver_path)
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)') # 下拉进度条
    time.sleep(10)
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    time.sleep(10)

如果之后遇到动态爬虫,则需要添加代理,代理池在redis的构建见后面更新

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值