selenium+bs对一个月的24小时天气数据进行爬虫（python）

最新推荐文章于 2024-04-28 22:25:00 发布

linsen333

最新推荐文章于 2024-04-28 22:25:00 发布

阅读量486

点赞数 1

文章标签： selenium python 定位

本文链接：https://blog.csdn.net/linsen333/article/details/104934803

版权

做毕设要找数据，因为要进行翻页操作，还是一个需要先登陆的网站，就舍弃了request选择了selenium。

登录
跟着下面这篇博客写的登陆环节，很有效。中间有一次没有办法正确登录，我把"taobaoCookies.pickle"这个文件删除就可以了（应该是因为cookie内容变了）
https://blog.csdn.net/qq_42348937/article/details/85065104
这里说一句，我再登陆后需要再进行点击才能进入我要的数据页面，所以在上述链接中代码的最后一行中的网址，我直接复制粘贴的有数据的那个页面网址，发现这样也凑效，就省去一次点击操作啦~
网页解析，爬取数据

    browser.get("你有数据的那个网址")
    html=browser.page_source
    bs = BeautifulSoup(html, "html.parser")  # 创建BeautifulSoup对象解析

    data0=bs.find('div', attrs={'class':'###', 'style':'###'}) # 获取指定div
    tbody= data0.find('tbody')
    tr = tbody.find_all('tr')  # 获取tr部分

    #写入数据
    temp=[]
    mon='1'
    temp.append(mon+'/'+str(i))
    for n in tr:
        td = n.find_all('td')  # 获取所有的td标签
        #print('td')
        #print(td)
        temp.append(td[1].text)

    '''#横轴标题
    timelist=[]
    for i in range(0,24):
        timelist.append(str(i) +':00')'''

    # 存储为csv
    with open('temp.csv', 'a+', encoding='utf-8', newline='') as f:
        writer = csv.writ

最低0.47元/天解锁文章

linsen333

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
selenium+bs对一个月的24小时天气数据进行爬虫（python）

做毕设要找数据，因为要进行翻页操作，还是一个需要先登陆的网站，就舍弃了request选择了selenium。登录跟着下面这篇博客写的登陆环节，很有效。中间有一次没有办法正确登录，我把"taobaoCookies.pickle"这个文件删除就可以了（应该是因为cookie内容变了）https://blog.csdn.net/qq_42348937/article/details/85065...
复制链接

扫一扫