python 爬虫获取，百度风云榜股票数据，保存csv格式

最新推荐文章于 2024-04-10 08:45:00 发布

置顶愤怒的马农

最新推荐文章于 2024-04-10 08:45:00 发布

阅读量3.9k

点赞数

分类专栏：爬虫 python 文章标签： python

本文链接：https://blog.csdn.net/weixin_43407092/article/details/119887100

版权

python 同时被 2 个专栏收录

38 篇文章 0 订阅

订阅专栏

爬虫

22 篇文章 2 订阅

订阅专栏

先看看执行结果

同路径下会有个 “风云榜.csv” 文件，下面是文件内容

下面是完整代码，复制粘贴就可以运行。有问题请留言。

# -*- coding:utf-8 -*
import requests, csv
from lxml import etree


class baidu(object):
    def __init__(self):
        self.urls = ['http://top.baidu.com/buzz?b=274&c=17&fr=topbuzz_b277_c17',
                     'http://top.baidu.com/buzz?b=277&c=17&fr=topbuzz_b274_c17',
                     'http://top.baidu.com/buzz?b=276&c=17&fr=topbuzz_b277_c17']
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.3945.79 Safari/537.36'}

    def get_all_data(self):
        for url in self.urls:
            response = requests.get(url, headers=self.headers)  # 获取请求
            response.encoding = response.apparent_encoding
            soup = etree.HTML(response.text)
            names = soup.xpath('//a[@class="list-title"]/text()')  # 获取名称
            name_ids = soup.xpath('//td[@class="last"]/span/text()')  # 获取id
            for (name, name_id) in zip(names, name_ids):
                self.Save(name, name_id)

    def Save(self, name, name_id):
        """保存数据"""
        with open('风云榜.csv', 'a', newline='', encoding='utf8') as f:
            spamwriter = csv.writer(f)
            spamwriter.writerow([name, name_id])

    def run(self):
        self.get_all_data()


if __name__ == '__main__':
    fps = baidu()
    fps.run()

愤怒的马农

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫获取，百度风云榜股票数据，保存csv格式

先看看执行结果同路径下会有个 “风云榜.csv” 文件，下面是文件内容下面是完整代码，复制粘贴就可以运行。有问题请留言。# -*- coding:utf-8 -*import requests, csvfrom lxml import etreeclass baidu(object): def __init__(self): self.urls = ['http://top.baidu.com/buzz?b=274&c=1...
复制链接

扫一扫