python、pandas文件合并、数据去重

IBoyMan

于 2018-02-27 12:42:38 发布

阅读量2.1k

点赞数 2

分类专栏： python、pandas学习文章标签： pandas、python、文件合并 panas数据去重 python、pandas算去重后出现的次数(UV) python多文件合并

本文链接：https://blog.csdn.net/IBoyMan/article/details/79386832

版权

目录下有如图60个txt文件，每个txt文件里的数据大概有7000万行目的：把每个txt文件里的数据去重后合并60个文件为一个总文件，然后把总文件里的数据按第一列、第二列分组第三列求去重后出现的次数每个文件的内容如下：代码如下：# -*- coding:utf-8 -*-from datetime import datetimeimpor...

摘要由CSDN通过智能技术生成

目录下有如图60个txt文件，每个txt文件里的数据大概有7000万行

目的：把每个txt文件里的数据去重后合并60个文件为一个总文件，然后把总文件里的数据按第一列、第二列分组

第三列求去重后出现的次数

每个文件的内容如下：

代码如下：

# -*- coding:utf-8 -*-

from datetime import datetime
import pandas as pd
import os

def Main():
    sourcr_dir = '/ford_tongji/uaad/'
    target_dir = '/ford/ford_tongji/uaad/distinct/'
    target_txt = '/ford/ford_tongji/uaad/distinct/merge_

最低0.47元/天解锁文章

IBoyMan

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python、pandas文件合并、数据去重

目录下有如图60个txt文件，每个txt文件里的数据大概有7000万行目的：把每个txt文件里的数据去重后合并60个文件为一个总文件，然后把总文件里的数据按第一列、第二列分组第三列求去重后出现的次数每个文件的内容如下：代码如下：# -*- coding:utf-8 -*-from datetime import datetimeimpor...
复制链接

扫一扫

专栏目录