Python爬虫之实例---用selenium爬取网易云评论

最新推荐文章于 2024-09-06 17:46:56 发布

才短思涩-求解

最新推荐文章于 2024-09-06 17:46:56 发布

阅读量1.4k

点赞数 6

分类专栏：爬虫 python学习文章标签： python selenium 网络爬虫

本文链接：https://blog.csdn.net/caribbean666/article/details/125730172

版权

python学习同时被 2 个专栏收录

10 篇文章 1 订阅

订阅专栏

爬虫

9 篇文章 1 订阅

订阅专栏

做题思路

1. 分析源码，确定信息所在位置

2.进行内容解析

3.将获取到的信息字典的方式保存到列表，然后再将列表信息保存到.csv文件中

import csv
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains

'''
https://music.163.com/#/song?id=399354373
目标：评论者的网名，与评论
需要切换iframe
鼠标行为连点击下一页
'''


class WYYmusic:  # 音乐
    # 初始化类
    def __init__(self):
        self.driver = webdriver.Chrome()

        self.driver.get('https://music.163.com/#/song?id=399354373')  # 打开链接
        self.driver.implicitly_wait(3)
        self.driver.switch_to.frame(self.driver.find_element(By.ID, 'g_iframe'))
    # 操作
    def operate(self):
        # 歌评论
        for self.i in range(10):
            self.SongReview = []
            divlist = self.driver.find_elements(By.XPATH, '//*[@class="itm"]/div[2]')
            # print(divlist)
            for item in divlist:
                # print(i)
                # 评论
                try:
                    commentdict = {}
                    comment = item.find_element(By.XPATH, './/div[@class="cnt f-brk"]').text
                    name = comment.split("：")
                    commentdict['name'] = name[0]
                    commentdict['comment'] = name[1]
                    self.SongReview.append(commentdict)
                    # print(comment)
                    # print(name)
                except Exception as e:
                    print()
            self.save()
            # print(SongReview)
            #定位下一页按钮
            button_tag=self.driver.find_element(By.XPATH,'//*[@class="m-cmmt"]/div[3]/div/a[11]')
            action=ActionChains(self.driver)
            action.move_to_element(button_tag)
            action.click()
            action.perform()
        self.driver.quit()

    def save(self):
        if self.i == 0:
            self.mod='w'
        else:
            self.mod="a"
        headers=['name','comment']
        with open('评论.csv',self.mod,encoding='utf-8-sig',newline='')as f:
            writers=csv.DictWriter(f,headers)
            if self.i==0:
                writers.writeheader()
            writers.writerows(self.SongReview)

# 程序主入口
if __name__ == "__main__":
    # 爬虫
    reptile = WYYmusic()
    reptile.operate()

博主B站链接：本座小白TT的个人空间_哔哩哔哩_Bilibili

GitHub链接： GitHub - MeteorPRC/Reptile