我已经编写了一些代码,基本上对两个pandas数据帧执行excel风格的vlookup,并希望加快速度。在
数据帧的结构如下:
数据库1_数据框列:
'VALUE'、'COUNT'、'GRID'、'SGO10GEO'
合并_数据框列:
“网格”、“ST0”、“ST1”、“ST2”、“ST3”、“ST4”、“ST5”、“ST6”、“ST7”、“ST8”、“ST9”、“ST10”
sgo公司_数据框列:
'mkey','类型'
为了合并它们,我做了以下操作:
1对于dbase1_df中的每一行,查找其“SGO10GEO”值与sgo_df的“mkey”值匹配的行。从sgo_df的该行中获取“type”。在“type”包含从0到10的整数。通过在类型中附加'ST'来创建列名。
在merged_df中找到值,其中它的“GRID”值与dbase1_df中的“GRID”值匹配,列名是我们在步骤2中获得的。将此值输出到csv文件中。
//将dbase1 dbf读入数据帧
dbase1_df=pandas.DataFrame.from\u csv(dbase1_文件,index_col=False)
合并的_df=pandas.DataFrame.from\u csv('合并.csv',索引_col=False)
卢普_写出来的([“值”,“类型”,提取_变量上限()])
//对于dbase1数据帧中的每个唯一值:
对于索引,d