1. 提取value_counts()的输出内容
Python中的value_counts()函数非常常用,但是在实际应用中,我们往往想要提取出它的输出内容。在Python中,我们查看该函数的输出结果或使用print打印结果,均会看到如下情况:
想把它的内容提取出来其实十分简单,一行代码就能够搞定。
# 提取到数据框
pd.DataFrame(df["EDUCATION"].value_counts())
#提取为字典
df["EDUCATION"].value_counts().to_dict()
2. Dataframe列名重命名
df.rename(columns={'原列名':'修改后的列名'}, inplace = True)
inplace参数为True时,原df会被修改,否则不会。
3. 新建Dataframe
DataFrame(data=None, index: 'Axes | None' = None, columns: 'Axes | None' = None, dtype: 'Dtype | None' = None, copy: 'bool | None' = None)
data参数必选。可以用index参数指明索引,默认创建整型索引;可以用dtype参数指定数据类型,默认为根据传入的数据进行推断;可以用columns赋予DataFrmae的列以名字。举例如下。
x = [1,2,3]; y = [4,5,6]
df2 = pd.DataFrame(data = {'x':x, 'y':y})
df2
结果:
# 新建一个列名与df相同的空Dataframe
df2 = pd.DataFrame(columns=df.columns)
4. 将数据框中只有空格的字段替换为缺失值
有时候有些数据中会出现只有空格的字符串,但不能识别为缺失值。替换为缺失值后,dropna才会起作用。
def Empty(s):
if len(str(s).strip())==0:
return None
else:
return s
运行效果:
x = [1," ",3]; y = [4,5,6]
df = pd.DataFrame(data = {'x':x, 'y':y})
df
df[["x"]] = df2[["x"]].applymap(Empty)
df
5. 忽视警告
import warnings
warnings.filterwarnings("ignore")
TBC.
祝大家生活愉快!