我有一个DataFrame:
>>> df
STK_ID EPS cash
STK_ID RPT_Date
601166 20111231 601166 NaN NaN
600036 20111231 600036 NaN 12
600016 20111231 600016 4.3 NaN
601009 20111231 601009 NaN NaN
601939 20111231 601939 2.5 NaN
000001 20111231 000001 NaN NaN
那么我只需要EPS不是NaN的记录,即df.drop(....)将返回如下数据帧:
STK_ID EPS cash
STK_ID RPT_Date
600016 20111231 600016 4.3 NaN
601939 20111231 601939 2.5 NaN
我该怎么做?
dropna:pandas.pydata.org /熊猫/稳定/生成/ Docs & hellip;
df.dropna(subset = ['column1_name', 'column2_name', 'column3_name'])
这个问题已经解决了,但是…
…还考虑了Wouter在其原始评论中提出的解决方案。处理丢失数据的能力,包括dropna(),是明确地内置于熊猫中的。除了可能比手动操作提高性能外,这些功能还提供了各种可能有用的选项。
In [24]: df = pd.DataFrame(np.random.randn(10,3))
In [25]: df.iloc[::2,0] = np.nan; df.iloc[::4,1] = np.nan; df.iloc[::3,2] = np.nan;
In [26]: df
Out[26]:
0 1 2
0 NaN NaN NaN
1 2.677677 -1.466923 -0.750366
2 NaN 0.798002 -0.906038
3 0.672201 0.964789 NaN
4 N