背景
我需要从DataFrame数据结构中选取部分内容并重新组成一个DataFrame,例如:从一个班级成绩总表中选出A类并重新组成一个列表。这么简单的功能我居然searching了一个多小时,网上垃圾资源太多了~~~最后还是自己总结出的经验。(有更好的解决方法欢迎交流)
思路
假设原有数据是table_raw, 创建一个空的dataframe(table_result), 然后遍历整个table_raw,将符合需求的记录添加到table_result中即可
涉及的知识点
- DataFrame的创建
- DataFrame元素提取
- DataFrame与Series数据合并
示例代码
import pandas as pd
# 原始输入(示例)
name = ['张三','李四','王五','刘麻子']
age = [13,12,11,12]
score = [84,40,90,98]
df_raw = pd.DataFrame({'name':name,
'score':score,
'age':age})
df_result = pd.DataFrame(columns=df_raw.columns) # 创建空的表
for i in range(df_raw.shape[0]): #遍历df_raw表
score = int(df_raw.iloc[i]['score']) #获取一条记录中某个字段的值
if score >= 90: #筛选逻辑
df_result = df_result.append(df_raw.iloc[i], ignore_index = True)
print('raw:')
print(df_raw)
print('result:')
print(df_result)
几个月以后我找到了更简便的方法,对于上述任务一句话搞定
df_result = df_raw[df_raw.score >= 90]