自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 【信息检索】大作业:jieba/gensim制作一个搜索引擎

设计思路利用jieba分词去停用词利用nltk进行词干提取、词形还原等预处理 (效果太差了)利用genism的bm25模型建立索引对于query设置置信区,并逐条搜索讲搜索内容写入字典按照指定格式输出字典内容# -*- coding:utf-8 -*-import nltk.tokenizeimport timeimport jieba"""———————————————————————————————————————————————————2020信息检索期末考试凌珑—

2020-07-05 00:27:01 871 1

原创 【c++】2020大一下期末考试小练习1

考试题目CPU是计算机的中央处理单元,是计算机的重要组成部分。计算机有很多具体的结构形式,其中有一种有多种防护等级的计算机被称为工业控制计算机(Industrial Personal Computer,IPC),该特殊形式的计算机经常被用于工业生产现场。请根据要求完成如下编程工作:1、 现有一个CPU类定义如下:class CPU{private: double m_MainFreq; //主频,单位GHz int m_CoreNum; //核心数 double m_Power;

2020-07-05 00:08:45 327

原创 【c++】2020大一下期末考试

解析: 注意要对输入数据不合格的情况进行处理考试题目基类说明现有CWorker 类描述如下:class CWorker{private:int m_ID; //工号string m_Name; //姓名int m_Sex; //性别 0代表女性 1代表男性int m_Age; //年龄public:CWorker(int ID, string Name, int Sex, int Age){if (Sex<0 || Sex>1){cout<<"性别初始

2020-07-05 00:03:04 1345 1

原创 【c++】2020大一下第二次考试

解析: 考题本身非常简单,需要注意书写格式(特别是我被扣分的注释QAQ)。考试题目请各位考生从课程教学群文件中下载数据文件account.txt,然后将数据文件手动保存在D 盘根文件夹下。按要求编写一个deposit 类,用于存储文件account.txt 中的数据。该文件中每行记录一个账户的信息,包含4 项数据,以tab字符分隔,各个字段的信息如下: 第 1 列表示账户名称name; 第 2 列表示账户存款余额balance; 第 3 列表示账户贷款余额loan; 第 4 列表示每次还

2020-07-04 23:52:24 268

原创 【c++】2020大一下期中考前小练习5

期中考前小练习5按以下要求编写程序题目说明请各位考生从课程信息发布网站下载数据文件input.txt,然后将两个数据文件手动保存在D盘根目录下。该文件中的数据以文本形式存储,其中包含了若干个同学的期中考试成绩记录,每个人最多有三门课,分别为Math、English和C++,每门课的成绩占一行,每行包括学号、课程名称和成绩,三者之间用‘\t’分开。请按要求依次完成如下操作:1、 编写一...

2020-04-30 19:33:04 498 1

原创 【c++】2020大一下期中考前小练习4

期中考前小练习4现有一个包含20个字符串的文本文件data.txt,同一行的字符串之间以空格分隔。请先拷贝数据文件data.txt到D:盘根目录,然后按要求完成如下操作:1、 编写一个函数,读取文件中的所有字符串,要求将所有字符串保存在向量中。2、 编写一个函数,将所有字符串输出到屏幕上,要求每个字符串一行。3、 编写一个函数,将第2步的所有字符串转换成整数,转换规则是以一个字符串中所...

2020-04-30 19:30:02 322

原创 【c++】2020大一下期中考前小练习3

期中考前小练习1按以下要求编写程序。请各位考生从课程信息发布网站下载数据文件input.txt,然后将该数据文件手动保存在D盘根目录中。在该文件中以文本文件的方式存放了若干个用于表示工人信息的结构体类型数据,每个工人信息占一行,每个工人的各数据之间以空格来间隔。结构体类型的声明如下所示。typedef struct{int ID; //工号string Name; //...

2020-04-30 19:27:45 275 1

原创 【c++】2020大一下期中考前小练习2

期中考前小练习2按以下要求编写程序题目说明请各位考生从课程信息发布网站下载数据文件data.txt,然后将该数据文件手动保存在C盘根目录中。在该文件中以文本文件的方式存放了若干用于表示用户信息的结构体类型数据,每个用户信息占一行,每个用户的各数据之间以空格来间隔。结构体及相关辅助类型的声明如下所示:typedef struct {int id;string name;int...

2020-04-30 19:25:04 284

原创 【c++】2020大一下c++期中考前小练习1

期中考前小练习1按以下要求编写程序题目说明请各位考生从课程信息发布网站下载数据文件data.txt,然后将该数据文件手动保存在D 盘根目录下。该文件中的数据以文本形式存储,每行包含3 列数据,格式如下:A 列和B 列都是单词,C列是同一行A 列和B 列中单词共同出现的次数,列之间用tab 隔开。文件总行数在千行以上,A 列或B 列的单词可能重复,如下面例子所示:A B C打 电...

2020-04-30 19:22:12 390

原创 【c++】2020大一下期中考试

考后总结:凡是open文件必检查是否打开,必close文件关于sort函数中的布尔型函数cmp:sort是严格弱序排列,即cmp在=时应该返回false,不然会断言错统计时用map,捯饬一个存pair结构的数据的vector再sort(map不可以sort),挺麻烦的。如果自己写个排序函数,也嫌麻烦,不妨一开始就用数组搞桶排序。一个独立的功能尽量用函数实现,并且尽可能减少代码冗余考试...

2020-04-30 19:15:01 931 1

原创 【KNN】处理鸢尾花数据集大作业

机器学习KNN算法(极其简单的入门算法)思路:输入训练集数据–>输入测试集数据–>计算–>创建Map统计数据–>输出一点点的修改:计算步骤,我仅仅计算了对应数据差的平方,没有开平方代码:#include<iostream>#include<sstream>#include<istream>#include<fstr...

2020-04-30 18:51:34 618

原创 【CSP】201912-2 回收站

思路:第二题就很简单,将判断是否是合格地址和统计四角点数分成两个函数,就可以了。不用vector和struct会更简洁。代码:#include<iostream>#include<vector>using namespace std;struct Point { int x, y;};bool judge(Point point, vecto...

2020-04-30 18:31:03 123

原创 【CSP】201703-3 markdown

中规中矩的解法。其中我遇到的坑是:在标题和无序列表中会出现空格(如# aaa bbb ccc,* a bc),如果仅仅用字符串流获取会导致结果出错。因此写了一个gettext函数。#include<iostream>#include<string>#include<algorithm>#include<sstream>usi...

2020-04-30 18:10:34 140

原创 【紫书】The Dole Queue, UVa133

紫书上的算法改了一改,觉得这样更容易让人理解。

2020-03-14 16:01:17 83

iris_trainingset.txt

我的鸢尾花数据训练集

2020-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除