需求来源为知友的一个提问:
pandas如何新增一列,对相同的行赋同一个值?www.zhihu.com希望将整行内容一样的内容做同样的标识,可能用于相同内容的筛选。话不多说,咱们直接进入解题。
首先先造个数据:
import
以上我们构造了四行数据,其中0和2相同,1和3相同,接下来就增加一列,预期为相同行为相同值,答案如下:
# 答案
我们拆分解析一下答题过程:
先将原数据加工成一个新的列,行数据为所有列的内容组成的列表:
df
使用 pandas.factorize() 将这个 Series 因子化:
Pandas 因子化(枚举化)值www.gairuo.com