查了忘,忘了查,查了还得忘,忘了还得查
dataframe 的生成
- 建一个空的dataframe:
aff_df = pd.DataFrame(columns = ["Index", "affiliation", "Aid"])
2. 把一个dict 直接转化为dataframe:
dfc = pd.DataFrame.from_dict(if_coauthor_with_discoverer, orient='index', dtype=int, columns=['if_coauthor_with_discoverer'])
pandas通过字典生成dataframe - chen狗蛋儿 - 博客园www.cnblogs.com把另一个dict 添加到现有的dataframe中,其中index 为DICT中的KEY,且一一对应;
res = res.append([{'qty1':10.0}], ignore_index=True)
result = pd.concat([df1, df4,df3], axis=1)
事实上, concat这个函数非常powerful,可以横向/纵向拼接。
pandas的连接函数concat()函数_zzpdbk的博客-CSDN博客blog.csdn.netdataframe 缺省值处理
现在我们有了一个dataframe了,但是可能会出现相关的缺省值,NaN,我们需要把它们进行删除,或用0/平均值/so on对其进行填充,否则会报错;此外,如果有缺省值的话,DTYPE好像是失效的
[455]pandas.DataFrame基本操作及缺失值处理_周小董-CSDN博客blog.csdn.net删除某列的所有空值所在的行
df.dropna(subset=['A','B'],inplace = True)
索引重置
df.reset_index(inplace=True,drop=True)
dataframe类型转换
result = result.astype({'if_coauthor_with_discoverer':'int'}) 数据类型转换:将某一列转化为int
读写
将这个写入dataframe 写入csv 文件中:
result.to_csv(‘variance.csv', sep=',', header=True, index=True)
读取:
adf = pd.read_csv('C:/Users/qzh/PycharmProjects/Aminor/PSM/variance.csv', sep=',', header=0,index_col=0)
遍历整个df:
df.index.values
for i in df.index.values:
df.loc[i]