参考资料:
pandas.DataFrame.sample - pandas 0.23.1 documentationpandas.pydata.org
转载自:https://zhuanlan.zhihu.com/p/38255793
DataFrame.sample
(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
从一列/行数据里返回指定数量的随机样本。
常用的几个参数解释:
n: 表示要选取样本的数量
frac: 表示要选取样本数量的百分数
random_state: 设定随机种子
举例:
data_model数据共279项
下图仅显示其中的5项
使用sample函数随机抽取数据:
train_data=data_model.sample(n=200,random_state=123)
亦可使用:
train_data=datamodel.sample(frac=0.7,random_state=123)
再选取剩下的数据作为测试集:
testdata=data_model[~data_model.index.isin(train_data.index)]