python读取多列csv文件_多列上的csvjoin

我有以下csv文件,我想Inner Join

CSV 1:行程_数据.csv(250 MB)head -2 rand_trip_data_1.csv

medallion,hack_license,vendor_id,rate_code,store_and_fwd_flag,pickup_datetime,dropoff_datetime,passenger_count,trip_time_in_secs,trip_distance,pickup_longitude,pickup_latitude,dropoff_longitude,dropoff_latitude

DFD2202EE08F7A8DC9A57B02ACB81FE2,51EE87E3205C985EF8431D850C786310,CMT,1,N,2013-01-07 23:54:15,2013-01-07 23:58:20,2,244,.70,-73.974602,40.759945,-73.984734,40.759388

CSV 2:旅行费(1.70GB)

^{pr2}$

我想合并以下列中的两个CSV文件:medallion,hack_license,pickup_datetime。在

我使用的是csvjoin,但它只允许我从每个csv文件中加入一列。有没有办法,我可以在连接条件中添加更多列。在

仅使用csvjoin在medallion上联接的查询:csvjoin -c medallion rand_trip_data_1.csv trip_fare_1.csv > trip_data_1.csv

在bash中查询(但它不起作用)join -t , -1 1,2,6 -2 1,2,4 rand_trip_data_1.csv trip_fare_1.csv > trip_data_1.csv

join: illegal field number -- 1,2,6

我也愿意接受其他bash/python建议。谢谢!在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值