1.pandas的数据结构
1.1 serise数据类型
1.1.1 serise的创建
1.1.1.1 未指定index
pd.Serise(list)
1.1.1.2 指定index
pd.Serise(list1,index = list2)
pd.Serise(dict)# 该dict的结构为{key1:value1…}
1.2 DataFrame数据类型
1.2.1 DataFrame的创建
通常都是通过字典来创建。
2. pandas的数据查询
2.1 loc属性
通过列名和行名实现精确查找
cell = df.loc[0,‘任务名称’]
print(cell)
传入两个列表实现批量查询
cells = df.loc[range(1,100),[‘任务名称’,‘任务性质’,‘价格’]]
print(cells)
使用区间进行范围查询
cells1 = df.loc[0:99,‘任务名称’:‘价格’]
print(cells1)
使用条件表达式查询
cells2 = df.loc[df[‘任务性质’] == ‘招标’,:]# 这里的冒号代表全部的列
print(cells2)
调用函数查询
lambda函数的格式 lambda 参数列表 : 表达式 (使用的前提条件是表达式只有一句代码,一个返回值)
cells3 = df.loc[lambda df:df[‘任务性质’] == ‘招标’,:]
print(cells3)