- 博客(31)
- 收藏
- 关注
原创 数据挖掘考前必背简答题
1.什么是数据挖掘?数据挖掘的功能有哪些?2.在数据挖掘之前为什么要对原始数据进行预处理?3.缺失值的处理有哪些方法?列出至少6种。4.什么是主成分分析?5.什么是关联规则?6.解释关联规则评价标准提升度,并写出其计算公式。7.简述K-means算法的输入、输出及聚类过程。8.简述DBSCAN算法优缺点9.什么是决策树?如何用决策树进行分类?10.简述ID3算法原理。11.简述提升(boosting)算法原理。
2024-01-01 20:06:47 444
原创 xls(csv)转xml代码,并且统计出总共有多少的类
其中xls(csv)文件中有class,width,height,xmin,xmax,ymin,ymax,filename
2023-12-06 17:27:38 453
原创 dp(旅游规划)
所有结点的最长路径和次长路径之和的最大值就是树的直径。总结:求树的直径时,只需dfs_d,定义两个d1,d2数组,分别存储每个节点向下走的最长路径的长度和次长路径的长度。如果还要求树的直径上的所有点,还要dfs_u,定义一个up数组,表示每个节点向上走能走的最远距离。p1数组表示每一个节点向下的最长路径所经过的直接子节点。更新方式为:dfs_u,画个图一目了然。
2023-03-23 23:15:57 63
原创 数据库考试救急资料
所谓第一范式是指数据库表的每一列都是不可分割的基本数据项,凤一列史丕能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。(2) 在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式,然后在基本表的基础上再建立必要的视图,形成数据的外模式;答: 外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码也称外码。自然连接与等值连接的区别:自然连接中相等的分量必须是相同的属性组,并且要在结果中去掉重复的属性,而等值连接则不必。
2023-02-20 21:26:22 134
原创 mysql删除主键的操作
网上查了是alter table table_name drop foreign key constraint_name,要解决的问题是constraint_name是什么?首先我想直接删除主键alter table table_name drop primary key但是无法成功,原因是有foreign key约束,所以先要把foreign key 约束给删了。上图foreign key是家庭成员_ibfk_1,我一开始以为是户头,试了好多次QAQ.然后通过上面的语句成功删除了约束。
2023-01-24 21:29:11 3927 2
原创 耍杂技的母牛(母牛叠罗汉问题)
一头牛支撑不住的可能性取决于它头上所有牛的总重量(不包括它自己)减去它的身体强壮程度的值,现在称该数值为风险值,风险值越大,这只牛撑不住的可能性越高。贪心算法的思想,将每个母牛的强壮程度和体重相加,再将其从小到大排序。农民约翰的N头奶牛(编号为1.. N )计划逃跑并加入马戏团,为此它们决定练习表演杂技。您的任务是确定奶牛的排序,使得所有奶牛的风险值中的最大值尽可能的小。这N头奶牛中的每一头都有着自己的重量wi 以及自己的强壮程度si。叠罗汉,表演时,奶牛们站在彼此的身上,形成一个高高的垂直堆叠。
2022-11-22 17:31:21 212
原创 合并果子问题
假定每个果子重量都为 1 ,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。该题为贪心算法的思想,用哈夫曼树的思想来做,就是将所有数中最小的两个数合并,一直合并知道合并为一个数,最后的结果就是合并的最小值。接着,将新堆与原先的第三堆合并,又得到新的堆,数目为 12 ,耗费体力为 12。每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。可以先将 1 、 2 堆合并,新堆数目为 3 ,耗费体力为 3。
2022-11-22 15:21:52 84
原创 区间的覆盖
思路:首先定义结构体,将各区间存储在结构体中,然后按左端点从小到大排序,搜索所有能覆盖指定区间的区间,不断更新右端点,知道能够完全覆盖指定的区间。
2022-11-22 14:48:24 48
原创 全国高校计算机能力挑战赛c++初赛
这题是要求最大子矩阵的和,首先求各个点到(0,0)的矩阵面积,即为是s[i][j]=s[i-1][j]+s[i][j-1]-s[i-1][j-1]+a[i,j],再求k*k内的杂草数量,即为w[i][j]=s[i][j]-s[i-k][j]-s[i][j-k]+s[i-k][j-k],w[i][j]的最大值就是答案。12月要参加全国计算机能力挑战赛,所以去网上搜了题目做了一下,大致都是一些常规思路,有大佬有更好的方法还望指点一番。第一行是2个正整数,分别为N和K(1≤K≤N≤1000)。
2022-11-20 17:20:44 1314
原创 2021全国高校计算机能力挑战赛初赛c++
各计算机的返回信号映射为一个0-15的数,其中从左到右第0位为1表示键盘故障、第1位为1表示鼠标故障、第2位为1表示显示故障、第3位为1表示声音故障。12月要参加全国计算机能力挑战赛,所以去网上搜了题目做了一下,大致都是一些常规思路,有大佬有更好的方法还望指点一番。第一行是一个N(0
2022-11-20 17:12:55 678 1
原创 2021年全国计算机能力挑战赛初赛c++试题
老式的计算机只能按照固定次序进行运算,华安大学就有这样一台老式计算机,计算模式为A @ B #C,@和#为输入的运算符(可能是+、*、%,须考虑计算优先级),现给出A,B,C的数值以及@和#对应的运算符,请你编写程序,验证老式计算机的运行结果。第一行是一个整数N(|N|≤10000),表示有N组计算数据需要处理,接下来N行,每行是相应的数据,包括三个整数和两个运算符,分别对应A、@、B、#和C。因为就三个运算符,所以也不想用栈做,直接暴力做。对每行输入的数据,输出计算结果。
2022-11-20 16:58:54 1835 2
原创 2021年全国计算机能力挑战赛C++题目
给定一个字符串S,和一个特定子串S1,如果该子串第k次出现则进行替换(ababa 视为出现了2次子串aba),替换规则是将子串中的每个英文字母修改为循环后移1位的字母(即a换成b,b换成c,依次类推,z换成a,大写字母同样处理),其他字符不变。如果不发生替换,输出F。暴力枚举字符串,子串和主串相同就都往后移,如果期间遇到不同子串回到起点,主串向后移动一位,如果子串遍历完,就说明子串中找到与之匹配的子串,于是whIle(k--)将主串中符合的子串加一。输出替换后的字符串;如果不发生替换,输出F。
2022-11-20 16:53:42 1832
原创 欧几里得扩展版
没有,因为a=4,b=2,m=5,gcd(4,2)=2,5a=4,b=2,m=5,gcd(4,2)=2,5是除不开22的,所以没有整数解!ax+by=gcd(a,0)ax+by=gcd(a,0),也就是:ax=gcd(a,0)=aax=gcd(a,0)=a,所以x=1x=1。那么a=2a=2,b=1b=1,m=3m=3,gcd(2,1)=1gcd(2,1)=1,33是11的倍数,所以这个方程一定要整数解。比如x=1x=1,y=1y=1就是一个整数解,还可以有x=−2x=−2,y=7y=7也是一组整数解。
2022-11-14 00:17:05 40
原创 快速幂
先预处理出来,每一个数都是上一个数的平方模p,所以我们从前往后平方k次就能把这logk个数预处理出来了。预处理完之后,我们就把a^k分成前面这若干个数的乘积就可以了。其实就是把k拆成若干2的次幂相加(也就是看一下k的二进制表示里面哪些位是1,把这些1对应的位,乘起来就可以了)。我们的目标是把a^k拆成前面预处理出来的若干数的乘积,(就是把k拆成若干2的次幂之和)快速幂的核心是反复平方法。
2022-11-14 00:08:59 30
原创 字符串哈希
将一个字符串转化为p进制的数,再将p进制转化为十进制,接着利用哈希表将值控制在0到2^64,利用unsigned long long就能实现,从而能够判断任意子字符串是否相同。
2022-10-15 16:18:58 55
原创 差分的想法
差分的思想和等差数列有很大关系,通过构造等差数列发现能够通过一个数组加一个常数实现另外一个数组在某个区间内加c,从而将O(n)的时间复杂度转化为O(1)的时间复杂度,大大提高了效率
2022-09-17 23:09:11 35
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人