使用dataframe时遇到的问题

最新推荐文章于 2023-12-08 19:07:32 发布

weixin_4412

最新推荐文章于 2023-12-08 19:07:32 发布

阅读量781

点赞数

本文链接：https://blog.csdn.net/weixin_44121197/article/details/106865904

版权

首先导入pandas

import pandas as pd

创建一个dataframe
可以用已有的dict直接创建，也可以先用list存储好数据再用list创建

用dict创建 >>>

dic1 = {'name': ['David', 'Bob']
		'age': [18, 20]
		'gender': ['Male', 'Male']}
df1 = pd.DataFrame(dic1)

用list创建 >>>

list1 = ['A','B','C']
list2 = ['a','b','c']
list3 = ['i','ii','iii']
frame = {'list1':list1, 'list2':list2, 'list3':list3}
df2 = pd.DataFrame(frame)

#改行索引
df.index = row_list
#改列索引

之前创建空dataframe的时候用力很笨的法子，就是把所有list都填None。写这篇文章的时候发现了一个新法子：

df = pd.DataFrame(columns=('a','b','c'))

之后再往里面填充数据就行。

要想填充数据再看看创建好的dataframe的一些信息 >>>

#看有几行几列
df2.shape
#读某一列的数据
df['col_name']
#读某一行的数据
df.loc['row_name']
df.iloc[i]
#根据行列指标读某一个数据
df['col_name']['row_name']
df.loc['row_name']['col_name']
#筛选具有特定元素的某几行
df_selected = df[(df['col_name'] == element)]

#统计某一列的值都出现过几次
df['col_name'].value_counts()
#要想再直接通过统计结果读取
df['col_name'].value_counts().index[i]

#dataframe扔掉某一列 + 转dict
df_dict = df.drop(['col_name']).to_dict()