Python自动化办公之数据保存

最新推荐文章于 2024-07-29 14:37:54 发布

宴师

最新推荐文章于 2024-07-29 14:37:54 发布

阅读量80

点赞数 1

分类专栏：自学编程陪伴学习 python 文章标签： python

本文链接：https://blog.csdn.net/qq_59418188/article/details/119821991

版权

自学编程同时被 3 个专栏收录

59 篇文章 2 订阅

订阅专栏

陪伴学习

56 篇文章 0 订阅

订阅专栏

python

22 篇文章 0 订阅

订阅专栏

第十五讲

数据保存之csv和excel

import requests
from lxml import etree
import json


# 请求数据的过程
def request_data(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'
    }

    response = requests.get(url=url, headers=headers)
    with open('music.html', 'w', encoding='utf-8') as fp:
        fp.write(response.text)

    # 请求到的html字符串返回
    return response.text


# 解析函数
def parse_data(html_string):
    root = etree.HTML(html_string)
    ul_list = root.xpath('//div[@class="songList"]/ul')

    song_list = []
    for ul_node in ul_list:
        li_list = ul_node.xpath('./li')
        for li_node in li_list:
            song_list.append({'name': li_node.xpath('./a/text()')[0],
                              'href': li_node.xpath('./a/@href')[0]})

    return song_list


def save_data(items):
    fp = open('music.csv', 'a', encoding='utf-8')

    for item in items:
        json_string = json.dumps(item, ensure_ascii=False)
        fp.write(json_string + '\n')

    fp.close()


if __name__ == '__main__':
    html_string = request_data(url='https://www.1ting.com/song_n.html')

    song_list = parse_data(html_string)

    save_data(song_list)

求赞！！！
你的支持就是我持续分享的动力

宴师

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python自动化办公之数据保存

第十五讲数据保存之csv和excelimport requestsfrom lxml import etreeimport json# 请求数据的过程def request_data(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/53
复制链接

扫一扫