获取列名
list(df)
[column for column in df]
df.columns.values
data.columns.tolist()
list(data.columns)
获取df形状
df.shape
第一个元素为行数,第二个元素为列数
获取某一列
df[name]
获取某一行
for j in df.index:
print(df.loc[j]) # 索引为i行
判断是不是NaN
if one_data['registration_date'] is not np.nan
添加一行数据
# 创建新的数据帧
df_row3 = pd.DataFrame([[4, 'D', '9%']], index=['row_3'], columns=['col_0', 'col_1', 'col_2'])
# 追加至原有数据帧尾部
df = df.append(df_row3)
添加新的一列
df[name] = xxx
随机抽取一行/若干行
- 随机抽取一行df.sample(1)
- 抽取一定比例df.sample(frac=0.5)
Pandas:移除重复数据
https://blog.csdn.net/bqw18744018044/article/details/79963344
按条件过滤
格式:df= df[条件]
df= df[df['WTGS_CODE'] == 100]