Python实用操作(一)

1. 提取value_counts()的输出内容

Python中的value_counts()函数非常常用,但是在实际应用中,我们往往想要提取出它的输出内容。在Python中,我们查看该函数的输出结果或使用print打印结果,均会看到如下情况:

想把它的内容提取出来其实十分简单,一行代码就能够搞定。 

# 提取到数据框
pd.DataFrame(df["EDUCATION"].value_counts())

#提取为字典
df["EDUCATION"].value_counts().to_dict()

2. Dataframe列名重命名

df.rename(columns={'原列名':'修改后的列名'}, inplace = True)

inplace参数为True时,原df会被修改,否则不会。

3. 新建Dataframe

DataFrame(data=None, index: 'Axes | None' = None, columns: 'Axes | None' = None, dtype: 'Dtype | None' = None, copy: 'bool | None' = None)

data参数必选。可以用index参数指明索引,默认创建整型索引;可以用dtype参数指定数据类型,默认为根据传入的数据进行推断;可以用columns赋予DataFrmae的列以名字。举例如下。

x = [1,2,3]; y = [4,5,6]
df2 = pd.DataFrame(data = {'x':x, 'y':y})
df2

 结果:

# 新建一个列名与df相同的空Dataframe
df2 = pd.DataFrame(columns=df.columns)

4. 将数据框中只有空格的字段替换为缺失值

有时候有些数据中会出现只有空格的字符串,但不能识别为缺失值。替换为缺失值后,dropna才会起作用。

def Empty(s):
    if len(str(s).strip())==0:
        return None
    else:
        return s

运行效果:

x = [1," ",3]; y = [4,5,6]
df = pd.DataFrame(data = {'x':x, 'y':y})
df

df[["x"]] = df2[["x"]].applymap(Empty)
df

5. 忽视警告

import warnings
warnings.filterwarnings("ignore")

TBC.

祝大家生活愉快!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值