假如存在file1.csv,有300行数据
name | age |
---|---|
李红 | 7 |
张三 | 8 |
孙六 | 6 |
…… | ……| |
王五 | 7 |
田一 | 9 |
同时存在file2.csv,仅50行姓名数据,这50个姓名数据被包含在file1内,要求只输出file2中这50行姓名数据及对应的age,代码如下:
import pandas as pd
import os
df1 = pd.read_csv('./file1.csv')
df2 = pd.read_csv('./file2.csv')
df = df1.merge(df2, on = "name")
new_df = df.drop_duplicates() # 删除多余行
new_df.to_csv('./merge.csv', index = False)
.txt文件转换成csv文件
import pandas as pd
file = "information.txt"
text = pd.read_csv(file, delimiter="\t") # 以tab为分隔符
text.to_csv("information.csv", encoding='utf-8', index=False)