一、现象
做建模的时候,有时候需要对数据进行负采样,就需要随机抽取数据,之前用SQL实现过order by rand(),附上链接解决方案:用户号出现多行,如何从中取其一并随机抽取100个用户号,但用Pandas如何实现,突然就犯了难,故做个笔记,后面坐地铁打开博客,可以及时复习巩固下。
二、解决方案
import pandas as pd
df = pd.read_csv('data.csv')
data = df.sample(n = 10000000)
解决方案:带疑问,多交流,勤动手,频思考