拆分txt文件

该代码段用于从anot_sort.txt文件中按75%的比例划分数据,创建训练集(train.txt)和测试集(test.txt)。首先计算文件的总行数,然后将前75%的行写入训练集,剩余的行写入测试集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

if __name__ == '__main__':
    fa = open('anot_sort.txt', 'r')
    count = len(fa.readlines())
    fa.close()
    train_n=int(count*0.75) #测试集正样本个数
    test_n=count-train_n #训练集正样本个数
    print(count,train_n,test_n)
    fa = open('anot_sort.txt', 'r')
    ftrain=open('train.txt', 'w')
    for line in fa.readlines()[:train_n]: # 训练集取前train_n
        ftrain.write(line)
    ftrain.close()
    fa.close()
    fa = open('anot_sort.txt', 'r')
    ftest = open('test.txt', 'w')
    for line in fa.readlines()[train_n:]:  # 测试集取剩余的
        ftest.write(line)
    ftest.close()
    fa.close()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值