Dfsample()用法

import pandas as pd

df = pd.DataFrame([[1,5.56], [2,5.7], [3,5.91], [4, 6.4], [5, 6.8], [6,7.05], [7, 8.9], [8, 8.7], [9, 9], [10, 9.05]], columns=['X', 'Y'])
# print(df)

#  frac:抽样比,就是样本量占全样本的比例,如frac=0.3 ,注意n和frac不能共存 replace:是否放回,默认是不放回,如果有放回(replace=True)
dfsample = df.sample(frac=1.0, replace=False)
print(dfsample)
print(dfsample.shape)
    X     Y
9  10  9.05
0   1  5.56
1   2  5.70
5   6  7.05
3   4  6.40
6   7  8.90
2   3  5.91
4   5  6.80
7   8  8.70
8   9  9.00
(10, 2)

df_1 = dfsample.drop_duplicates()   # 去重
print(df_1)
print(df_1.shape)

X     Y
9  10  9.05
0   1  5.56
1   2  5.70
5   6  7.05
3   4  6.40
6   7  8.90
2   3  5.91
4   5  6.80
7   8  8.70
8   9  9.00
(10, 2)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值