取csv文件中的多列保存到新的csv中


前言

大量csv中并非所有数据都可以为我所用,就需要选择其中的多行多列来简化数据

本次处理是针对多个csv,分别取每个文件的多列,再逐个保存到新的csv中


提示:以下是本篇文章正文内容,下面案例可供参考

一、直接上代码

代码如下

# !/user/bin/env python3
# -*- coding: utf-8 -*-

import os
import datetime
import pandas as pd

starttime = datetime.datetime.now()

if __name__ == '__main__':

    filenames_in = 'E:\...\col_del'  # 输入文件的文件地址
    filenames_out = 'E:\...\col_take'  # 新文件的地址
    for files in os.walk(filenames_in):
        file = files[2]
        for i in range(len(file)):
            name = file[i]
            domain1 = os.path.abspath(filenames_in)  # 待处理文件位置
            info = os.path.join(domain1, name)  # 拼接出待处理文件名字
            print(info, "开始处理")
            df = pd.DataFrame(pd.read_csv(info, header=None, names=[ '**', '**', '**', '**', '**', '**']))  # 读取原csv为dataframe,指定列名
            df_col = df[['**', '**', '**', '**', '**', '**']]	# 取需要的列,指出df中的列明即可
            domain2 = os.path.abspath(filenames_out)  # 处理完文件保存地址
            outfo = os.path.join(domain2, name)  # 拼接出新文件名字
            df_col.to_csv(outfo, header=None, index=None, encoding='utf-8')	# 保存取出的数据df_col为csv
            print(info, "处理完")

endtime = datetime.datetime.now()
print(endtime - starttime)


总结

也是一次很简单的操作,处理过程中简单的一步,希望对大家有所帮助。 每天进步一点点!!!
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值