Pandas指定行进行去重更新值
加载数据
首先,我们需要加载到所需要的数据,这里我们所需要的数据是同过sample函数采样过来的。
import pandas as pd
#这里说明一下,clean_beer.csv数据有两千多行数据
#所以从其中采样一部分,来进行演示,当然可以简单实用data.head()也可以做练习
data = pd.read_csv('clean_beer.csv')
data_sam = data.sample(frac=0.1,weights=data['ounces'].values)
data_sam1 = data_sam
data_sam
我们采用data[‘ounces’]列为权重对数据进行采样,并将结果赋值给data_sam1,其中data_sam和data_sam1是后续我们需要用到的两个数据(因为需要将两个数据合并,并去除重复)
此时,data_sam和data_sam1的数据是一样的。
data_sam数据
data_sam