【c++】2020大一下c++期中考前小练习1

  • 期中考前小练习1

按以下要求编写程序
题目说明
请各位考生从课程信息发布网站下载数据文件data.txt,然后将该数据文件手动保存在D 盘根目
录下。该文件中的数据以文本形式存储,每行包含3 列数据,格式如下:A 列和B 列都是单词,C
列是同一行A 列和B 列中单词共同出现的次数,列之间用tab 隔开。文件总行数在千行以上,A 列
或B 列的单词可能重复,如下面例子所示:
A B C
打 电话 2
喝 啤酒 3
打 人 5
吃 苹果 6
打 电话 1
… … …
上面第一行表示“打”和“电话”两个单词在文档1 中共同出现了2 次,最后一行表示这两个单
词在文档2 中一起出现了1 次,诸如此类。
定义结构体unit 和unita,用来存储如下数据:
typedef struct {
string a; //存储A列的单词
string b; //存储B列的单词
int cab; //存储单词a和单词b在所有文档中共同出现次数的总和
} unit;
typedef struct{
string a; //A列的单词
int ca; //单词a在所有文档中出现的次数总和
}unita;
比如在上面的示例中,“打”和“电话”共同出现的次数总和为2+1=3 次,“打”单独出现的次数
总和为2+5+1=8 次。
请按要求依次完成如下操作:
1、 编写一个函数read_data,读取data.txt 文件中的所有数据,并将它们存放在一个unit 的向量vunit
中,要求向量里所有单元的a 和b 都不重复,对重复的a 和b,将它们共同出现次数累加到c 中。
(注意:向量不同单元中的单个a 或单个b 可以相同,但不允许a 和b 同时相同)
2、 编写一个函数cal_counts,以引用方式将vunit 传递给该函数,并计算A 列单词在所有文档中出现
的次数,将计算结果保存在另一个向量vector vunita 中。
3、 编写一个排序函数sort_units,将向量vunit 中的元素按照出现次数cab 由高到低排序。
4、 编写一个重载的排序函数sort_units,将向量vunita 中的元素按照出现次数ca 由高到低排序。
5、 编写一个函数print_top_units,将排序后的向量vunita 中的前20 个元素按下面显示格式输出到屏
幕上:
显式a,显示宽度为10,不足的以
“S”补齐,向左对齐
显式ca,显式宽度5,不足的以“$”补
齐,向左对齐
打 $$ 8 吃 8 吃 8$$6
6、 编写一个条件概率计算函数cal_probs,以引用方式将vunit 和vunita 传递给该函数,计算一个概
率表,并将该概率表输出到文件prob.txt 中(同样存放在d 盘根目录下),文件每一行格式为:A
列单词a ||| B 列单词b||| p(b|a),即给定A 列一个单词的情况下,B 列某个单词出现的概率p(b|a)=
cab/ca,如按照上面的例子p(电话|打)=3/8=0.375。按照vunit 中元素的顺序将以上概率输出到文件
prob.txt 中。(注意,只需计算vunit 中出现的A 列单词和B 列单词对的概率,vunit 中没有出现的
A、B 列单词组合无需考虑)
7、 main 函数如下:
int main() {
string rfn = “d:\data.txt”;
string wfn =“d:\prob.txt”;
vector vunit;
vector vunita;
read_data(rfn, vunit);
cal_counts(vunit, vunita);
sort_units(vunit);
sort_units(vunita);
cout << “A列单词出现次数前20:” << endl;
print_top_units(vunita);
cout <<“计算条件概率并输出到:” <<wfn<< endl;
cal_probs(vunit, vunita, wfn);
return 0;
}

#include<iostream>
#include<sstream>
#include<istream>
#include<fstream>
#include<string>
#include<vector>
#include<algorithm>
#include<iomanip>

using namespace std;


typedef struct {
	string a; //存储A列的单词
	string b; //存储B列的单词
	int cab; //存储单词a和单词b在所有文档中共同出现次数的总和
} unit;
typedef struct {
	string a; //A列的单词
	int ca; //单词a在所有文档中出现的次数总和
}unita; 

void read_data(string& rfn, vector<unit>& vunit) {
	vunit.clear();
	ifstream data(rfn, ios::in);
	int count=0;
	while (!data.eof()) {
		string tempstr;
		getline(data, tempstr);
		istringstream ss(tempstr);
		string A, B;
		int C;
		ss >> A >> B >> C;		
		unit tempunit = { A,B,C };
		int flag = 0;
		for (int i = 0; i < count; i++) {
			if (vunit[i].a == tempunit.a && vunit[i].b == tempunit.b) {
				vunit[i].cab += tempunit.cab;
				flag = 1;
				break;
			}
		}
		if (!flag) {
			vunit.push_back(tempunit);
			count++;
		}
	}
	
	data.close();
}

void cal_counts(vector<unit>& vunit, vector<unita>& vunita) {
	int count=0;
	for (vector<unit>::iterator it = vunit.begin(); it != vunit.end(); it++) {
		unita tempunita = {(*it).a,(*it).cab};
		int flag = 0;
		for (int i = 0; i < count; i++) {
			if (vunita[i].a == tempunita.a) {
				vunita[i].ca += tempunita.ca;
				flag = 1;
				break;
			}
		}
		if (!flag) {
			vunita.push_back(tempunita);
			count++;
		}
	}
}
bool cmpunit(unit i, unit j) {
	if (i.cab > j.cab)return true;
	else return false;
}
void sort_units(vector<unit>& vunit) {
	sort(vunit.begin(), vunit.end(), cmpunit);
}

bool cmpunita(unita i, unita j) {
	if (i.ca > j.ca)return true;
	else return false;
}
void sort_units(vector<unita>& vunita) {
	sort(vunita.begin(), vunita.end(), cmpunita);
}

void print_top_units(vector<unita>& vunita) {
	for (int i = 0; i < 20; i++) {
		cout << setw(10) << left << setfill('S')<<vunita[i].a ;
		cout << setw(5) <<right<< setfill('$') << vunita[i].ca << endl;
	}
}

void cal_probs(vector<unit>&vunit,vector<unita> &vunita,string wfn) {
	ofstream ofile(wfn, ios::out);
	for (vector<unit>::iterator it=vunit.begin();it!=vunit.end();it++) {
		for (vector<unita>::iterator ita = vunita.begin(); ita != vunita.end(); ita++) {
			if ((*it).a == (*ita).a) {
				cout << (*it).a << " ||| " << (*it).b << " ||| " << double((*it).cab) / (*ita).ca << endl;
				ofile << (*it).a << " ||| " << (*it).b << " ||| " << double((*it).cab) / (*ita).ca << endl;
				break;
			}
		}
	}
}
int main() {
	string rfn = "d:\\data.txt";
	string wfn = "d:\\prob.txt";
	vector<unit> vunit;
	vector<unita> vunita;
		for (vector<unita>::iterator it = vunita.begin(); it != vunita.end(); it++) {
		cout << (*it).a << (*it).ca << endl;
	}
	read_data(rfn, vunit);
	cal_counts(vunit, vunita);
	sort_units(vunit);
	sort_units(vunita);
	cout << "A列单词出现次数前20:" << endl;
	print_top_units(vunita);
	cout << "计算条件概率并输出到:" << wfn << endl;
	cal_probs(vunit, vunita, wfn);
	
	return 0;
}

【20200430】

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值