随机带权选取文件中一行

9 篇文章 0 订阅
8 篇文章 1 订阅
本程序实现从文件中随即选取一行,每行被选中的概率与改行长度成正比。
程序用一次遍历,实现带权随机选取。
算法:假设第i行权重wi(i=1...n).读取到文件第i行时,以概率wi/(w1+w2+...+wi)
用该行替换上一轮被选中的行,直至读取文件结束。这样可以从数学上保证i行

被选中的概率为wi/(w1+w2+...+wn);

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<time.h>
#include <limits.h>
#define BUFSIZE 4096
char selected[BUFSIZE];
void randselect(FILE*fp);
void main(int argc,char* argv[])
{
  srand(time(NULL));
  FILE *fp;
  if(argc!=1&&argc!=2)
  {
    fprintf(stderr,"Invalid argument number.");
    exit(1);
  }
  if(argc==1)
    fp=stdin;
  else
   {
    if(NULL==(fp=fopen(argv[1],"r")))
    {
      fprintf(stderr,"cann't open %s\n",argv[1]);
      exit(2);
    }
   }
    randselect(fp);
    printf("%s",selected);
    fclose(fp);
   exit(0);
}

void randselect(FILE*fp)
{
  char *line=NULL;
  size_t size = 0; 
  long int len,sumlen=0;
  while((len=getline(&line,&size,fp))!=-1)
  {
   long int prelen=sumlen;
   sumlen+=len;
   long int tmp=(long int)((double)rand() / RAND_MAX *LONG_MAX) ;//扩大随机数的范围
   tmp%=sumlen;							 
   if(tmp>=prelen)  //以[prelen,sumlen-1]/[0,sumlen-1]的概率换入该行
   strcpy(selected,line);
  }
}



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

聚沙塔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值