我有以下csv文件,我想Inner Join
CSV 1:行程_数据.csv(250 MB)head -2 rand_trip_data_1.csv
medallion,hack_license,vendor_id,rate_code,store_and_fwd_flag,pickup_datetime,dropoff_datetime,passenger_count,trip_time_in_secs,trip_distance,pickup_longitude,pickup_latitude,dropoff_longitude,dropoff_latitude
DFD2202EE08F7A8DC9A57B02ACB81FE2,51EE87E3205C985EF8431D850C786310,CMT,1,N,2013-01-07 23:54:15,2013-01-07 23:58:20,2,244,.70,-73.974602,40.759945,-73.984734,40.759388
CSV 2:旅行费(1.70GB)
^{pr2}$
我想合并以下列中的两个CSV文件:medallion,hack_license,pickup_datetime。在
我使用的是csvjoin,但它只允许我从每个csv文件中加入一列。有没有办法,我可以在连接条件中添加更多列。在
仅使用csvjoin在medallion上联接的查询:csvjoin -c medallion rand_trip_data_1.csv trip_fare_1.csv > trip_data_1.csv
在bash中查询(但它不起作用)join -t , -1 1,2,6 -2 1,2,4 rand_trip_data_1.csv trip_fare_1.csv > trip_data_1.csv
join: illegal field number -- 1,2,6
我也愿意接受其他bash/python建议。谢谢!在