let cols= df.get_column_names();
let mut res: Vec<HashMap<String,String>>=Vec::new();
for i in 0..df.shape().0{
let row=df.get_row(i);
let mut tmp:HashMap<String, String>=HashMap::new();
cols.iter().enumerate().for_each(|(col_index,col_name)|{
let getv=row.0.get(col_index).unwrap();
tmp.insert(String::from(*col_name), getv.to_string());
});
res.push(tmp);
}
这段代码的目的是将一个数据框(DataFrame)中的数据转换为一个包含多个哈希映射(HashMap)的向量(Vec),其中每个哈希映射代表数据框中的一行数据。
让我们逐行解释这段代码:
-
let cols = df.get_column_names();
这行代码获取了数据框df
中的列名,并将它们保存在一个向量cols
中。 -
let mut res: Vec<HashMap<String, String>> = Vec::new();
这行代码创建了一个可变的向量res
,其中每个元素都是一个哈希映射,该哈希映射将列名作为键(key),将对应行中的数据作为值(value)。初始时,向量是空的。 -
for i in 0..df.shape().0 { ... }
这是一个循环,用于遍历数据框的每一行。df.shape().0
返回数据框的行数,循环将从 0 开始,逐步递增,直到达到最后一行。 -
let row = df.get_row(i);
这行代码获取数据框df
中的第i
行,并将其保存在变量row
中。这里假设get_row()
方法返回一个包含该行数据的元组。 -
let mut tmp: HashMap<String, String> = HashMap::new();
这行代码创建一个空的哈希映射tmp
,用于存储当前行数据的键值对。 -
cols.iter().enumerate().for_each(|(col_index, col_name)| { ... });
这是一个遍历cols
向量的循环,其中enumerate()
方法用于同时获取列名的索引 col_index 和对应的列名 col_name。循环内的代码将执行以下操作。 -
let getv = row.0.get(col_index).unwrap();
这行代码获取当前行中索引为 col_index 的元素,并将其保存在变量getv
中。这里假设row.0
是一个包含行数据的向量。 -
tmp.insert(String::from(*v), getv.to_string());
这行代码将键值对插入到tmp
哈希映射中,其中键是列名 col_name 的克隆(转换为String
),值是从行数据中获取的元素getv
的字符串表示。 -
res.push(tmp);
这行代码将填充好的哈希映射tmp
添加到结果向量res
中,表示已处理完一行数据。
通过循环遍历数据框的每一行,将每一行的数据转换为一个哈希映射,并将这些哈希映射添加到结果向量中,最终得到了一个包含整个数据框数据的向量。