Pandas基本用法
if __name__ == '__main__':
df = pd.DataFrame({"a": [1, pd.NA, 3, 4, pd.NA], "b": [4, 5, 6, 7, 8]})
print(df)
print(df["a"])
print(df[1:3]) #1-3行(行为索引值)(左闭右开),行号从0开始算
print(df.loc[3]) #第3行
print(df.loc[3, 'a']) #第3行a列
print(df.loc[1:3, ["a"]]) #1-3行,a列
print(df[df['a'] > 3]) #a列大于3的行
print(df[(df['a'] > 3) & (df['b'] > 6)]) #逻辑运算筛选(&(AND),~(NOT)和|(OR))
print(df[df['a'].isin([1, 2, 3])]) #筛选
df.loc[1, 'a'] = '3' #数据更新
print(df.isnull()) #显示所有行列的结果
print(df.isnull().any()) #显示列的结果
df.fillna(0, inplace=True) #替换NA
print(df['a'].value_counts()) #统计次数
print(df['a'].value_counts().to_dict())
df['a'].map(print) #给列中的每一个元素应用函数
df['a'].apply(print)
df.applymap(print) #给DataFrame中的所有单元应用函数
df.apply(print)
参考链接
- https://www.jianshu.com/p/0f6749c23d0f