爬取微博内容

1.爬取微博内容

2.使用selenium

3.完整代码

from selenium import webdriver
import time
import csv

def spider(url):
    driver = webdriver.Chrome()
    # 输入京东地址
    driver.get(url)
    driver.maximize_window()  # 窗口最大化
    time.sleep(20)
    k = []
    for i in range(3):
        goods = driver.find_elements_by_xpath('//*[@id="pl_feedlist_index"]/div[1]/div[@class="card-wrap"]')
        # good = driver.find_elements_by_class_name('txt')
        # print(len(goods))
        for j in goods:
            i=j.find_elements_by_class_name('txt')
            for a in i:
                if a.text=="":
                    break
                b=a.text.replace('\n', '').replace(' ', '')
                k.append([b])
                print(b)
        driver.find_element_by_partial_link_text('下一页').click()
        time.sleep(2)



    with open("微博.csv", "w", newline="",encoding="utf-8-sig") as datacsv:
        csvwriter = csv.writer(datacsv, dialect=("excel"))
        csvwriter.writerow("微博内容")
        for i in k:
            csvwriter.writerow(i)
    driver.quit()


if __name__ == '__main__':
    spider('https://s.weibo.com/weibo/%25E5%25B9%25BF%25E4%25B8%259C%25E7%2596%25AB%25E6%2583%2585?topnav=1&wvr=6&b=1')

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萧鼎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值