首先导入pandas
import pandas as pd
创建一个dataframe
可以用已有的dict直接创建,也可以先用list存储好数据再用list创建
用dict创建 >>>
dic1 = {'name': ['David', 'Bob']
'age': [18, 20]
'gender': ['Male', 'Male']}
df1 = pd.DataFrame(dic1)
用list创建 >>>
list1 = ['A','B','C']
list2 = ['a','b','c']
list3 = ['i','ii','iii']
frame = {'list1':list1, 'list2':list2, 'list3':list3}
df2 = pd.DataFrame(frame)
#改行索引
df.index = row_list
#改列索引
之前创建空dataframe的时候用力很笨的法子,就是把所有list都填None。写这篇文章的时候发现了一个新法子:
df = pd.DataFrame(columns=('a','b','c'))
之后再往里面填充数据就行。
要想填充数据再看看创建好的dataframe的一些信息 >>>
#看有几行几列
df2.shape
#读某一列的数据
df['col_name']
#读某一行的数据
df.loc['row_name']
df.iloc[i]
#根据行列指标读某一个数据
df['col_name']['row_name']
df.loc['row_name']['col_name']
#筛选具有特定元素的某几行
df_selected = df[(df['col_name'] == element)]
#统计某一列的值都出现过几次
df['col_name'].value_counts()
#要想再直接通过统计结果读取
df['col_name'].value_counts().index[i]
#dataframe扔掉某一列 + 转dict
df_dict = df.drop(['col_name']).to_dict()