python合并csv文件_python:pandas合并csv文件的方法(图书数据集成)

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

20180412094933.jpg

ReaderRentRecode.csv:

20180412094941.jpg

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-

import csv as csv

import numpy as np

# -------------

# csv读取表格数据

# -------------

'''

csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))

header = csv_file_object.next()

print header

print type(header)

print header[1]

data = []

for row in csv_file_object:

data.append(row)

data = np.array(data)

print data[0::, 0]

'''

# -------------

# pandas读取表格数据

# -------------

import pandas as pd

df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表

'''

print df.head()

print '----------------'

print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列

print '------------------------------------------------------------------'

print

'''

dd = pd.read_csv('ReaderInformation.csv')

'''

print dd.head()

print '----------------'

print dd[['读者证号', '读者性别', '读者单位', '读者类别']]

print '------------------------------------------------------------------'

print

'''

data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接

data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]

print data

print '------------------------------------------------------------------'

print

# -------------

# pandas写入表格数据

# -------------

data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv

20180412095019.jpg

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值