关于CSV文件数据集的处理

最新推荐文章于 2024-05-26 00:15:00 发布

西瓜西瓜我是大宝�

最新推荐文章于 2024-05-26 00:15:00 发布

阅读量2.4k

点赞数

分类专栏：心得体会文章标签： csv python

本文链接：https://blog.csdn.net/asszyq/article/details/109579855

版权

心得体会专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在处理大型CSV数据集时，如果目标只是截取其中一部分数据，则需要对数据进行处理，处理的思想如下：
打开需要读取和写入的CSV文件，按行读取文件中的数据，在这里读取出来的一行数据被放在了一个列表中，列表中存储的都是字符串类型：

with open(fileread,'r')as file_to_read：
        for row in reader:
            print(row)

['1', '31', '95', '26.834']
['1', '31', '96', '27.852']
['1', '31', '97', '28.348']

因此多做一步，挨个遍历存储行数据的列表，挨个遍历，将数据字符串型数据强转为浮点型。然后将转成浮点型的数据再写入CSV文件。

    with open(filewrite,'w+',newline='', encoding='GBK')as file_to_write:
        reader=csv.reader(file_to_read)
        data_list=[]
        writer=csv.writer(file_to_write)
        i=0
        for row in reader:
            print(row)
            for j in row:
                j=float(j)
                data_list.append(j)
            print(len(data_list))
            if (data_list[2]>42)&(data_list[2]<=54):
                writer.writerow(row)
                print(data_list)
            data_list=[]
            i+=1
            if i>=4464:
                break

实现对数据集的提取。

西瓜西瓜我是大宝�

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
关于CSV文件数据集的处理

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar
复制链接

扫一扫