pandas 文本处理备忘

 

# 统计某个字段下有哪些类别及数量
df['category'].value_counts()

 

# 将多个相同的 df 合并
https://blog.csdn.net/qq_41853758/article/details/83280104 

 

# 空值处理
# https://blog.csdn.net/lwgkzl/article/details/80948548
# 去除含有空值的行,并直接在原数据(df)上修改
df.dropna( inplace = True )

 

# 重置索引 reset_index
# https://blog.csdn.net/lujiandong1/article/details/52929090
# https://www.cnblogs.com/keye/p/11229863.html

# 重置一下索引,inplace=True 在原数据(df_pro)上修改;
# 不想保留原来的index,drop=True
df_pro.reset_index( inplace = True, drop = True)

 

# 设置显示宽度
pd.set_option('display.max_colwidth', 170)


# 设置行数全部显示
pd.set_option('display.max_rows', None)

 

# 取交集
https://www.cnblogs.com/kaerxifa/p/13155768.html

pd.merge(df1,df2)


# 取差集
https://www.cnblogs.com/jaysonteng/p/12360604.html

 

# 从 dataframe 里挑选特定的行

# 挑选id值为0、3、4、11的行
df[ df['id'].isin( [0, 3, 4, 11] ) ]

# 另一种写法
df[ df.id.isin( [0, 3, 4, 11] ) ]

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值