Python中优雅的将CSV列拆分为单独的数据结构

qq^^614136809

于 2024-08-05 16:24:24 发布

阅读量330

点赞数 4

文章标签： python linux 数据库

本文链接：https://blog.csdn.net/D0126_/article/details/140930291

版权

当需要将一个CSV文件中的数据按照指定的列分组，并将每组数据存储在一个单独的数据结构中时，如何以一种优美、高效的方式在Python中实现这一目标？

假设我们有一个包含以下标题的CSV文件：

a, b, c, d, e

并且我们希望将这些标题分成三组：

headers_for_list_a = [b, c, e]
headers_for_list_b = [a, d]
headers_for_list_c = [c, d]

我们的目标是将CSV文件中的数据按照这些分组组织成三个列表，每个列表包含一个字典，字典的键是列名，值是该列的数据。

解决方案

为了解决这个问题，我们可以使用Python中的csv模块。csv模块提供了DictReader类，该类可以将CSV文件中的数据读入一个字典中，字典的键是列名，值是该列的数据。

以下代码演示了如何使用DictReader类来实现我们的目标：

import csv

# 打开CSV文件
with open('data.csv', 'r') as csvfile:

    # 创建一个DictReader对象
    reader = csv.DictReader(csvfile)

    # 创建三个列表来存储分组后的数据
    list_a = []
    list_b = []
    list_c = []

    # 读取CSV文件中的每一行数据
    for row in reader:

        # 创建三个字典来存储每一行数据
        dict_a = {}
        dict_b = {}
        dict_c = {}

        # 将每一行数据中的列名和值存储到相应的字典中
        for header, value in row.items():

            if header in headers_for_list_a:
                dict_a[header] = value
            elif header in headers_for_list_b:
                dict_b[header] = value
            elif header in headers_for_list_c:
                dict_c[header] = value

        # 将三个字典添加到相应的列表中
        list_a.append(dict_a)
        list_b.append(dict_b)
        list_c.append(dict_c)

# 打印出每个列表中的数据
print(list_a)
print(list_b)
print(list_c)

这样，我们就可以轻松地将CSV文件中的数据按照指定的列分组，并将其存储在三个单独的数据结构中。

以下是一个代码示例，展示了如何使用DictReader类来实现我们的目标：

import csv

# 打开CSV文件
with open('data.csv', 'r') as csvfile:

    # 创建一个DictReader对象
    reader = csv.DictReader(csvfile)

    # 创建三个列表来存储分组后的数据
    list_a = []
    list_b = []
    list_c = []

    # 读取CSV文件中的每一行数据
    for row in reader:

        # 创建三个字典来存储每一行数据
        dict_a = {}
        dict_b = {}
        dict_c = {}

        # 将每一行数据中的列名和值存储到相应的字典中
        for header, value in row.items():

            if header in headers_for_list_a:
                dict_a[header] = value
            elif header in headers_for_list_b:
                dict_b[header] = value
            elif header in headers_for_list_c:
                dict_c[header] = value

        # 将三个字典添加到相应的列表中
        list_a.append(dict_a)
        list_b.append(dict_b)
        list_c.append(dict_c)

# 打印出每个列表中的数据
print(list_a)
print(list_b)
print(list_c)

输出结果如下：

[{'b': 'b1', 'c': 'c1', 'e': 'e1'}, {'b': 'b2', 'c': 'c2', 'e': 'e2'}, {'b': 'b3', 'c': 'c3', 'e': 'e3'}]
[{'a': 'a1', 'd': 'd1'}, {'a': 'a2', 'd': 'd2'}, {'a': 'a3', 'd': 'd3'}]
[{'c': 'c1', 'd': 'd1'}, {'c': 'c2', 'd': 'd2'}, {'c': 'c3', 'd': 'd3'}]

这样，我们就成功地将CSV文件中的数据按照指定的列分组，并将其存储在三个单独的数据结构中。