copy的july的题目
该文章链接:http://blog.csdn.net/v_july_v/article/details/7974418
1. 谈谈你对面向对象编程的认识
面向对象的几大特征:封装、继承、多态,扯扯这些玩意
2. 8月20日,金山面试,题目如下:
数据库1中存放着a类数据,数据库2中存放着以天为单位划分的表30张(比如table_20110909,table_20110910,table_20110911),总共是一个月的数据。表1中的a类数据中有一个字段userid来唯一判别用户身份,表2中的30张表(每张表结构相同)也有一个字段userid来唯一识别用户身份。如何判定a类数据库的多少用户在数据库2中出现过?来源:http://topic.csdn.net/u/20120820/23/C6B16CCF-EE15-47C0-9B15-77497291F2B9.html。
数据库不是我擅长的
3. 一个单词单词字母交换,可得另一个单词,如army->mary,成为兄弟单词。提供一个单词,在字典中找到它的兄弟。描述数据结构和查询过程。评点:同去年9月份的一道题,见此文第3题:http://blog.csdn.net/v_july_v/article/details/6803368。
这道题确实不难,可以建立这样的词典,按所有字母的顺序排列的单词,army可以保存为amry,先排序,之后建立词典。
建立好词典之后,每次查询一个单词,先将此单词sort后,然后查询即可
4. 线程和进程区别和联系。什么是“线程安全”
5. C和C++怎样分配和释放内存,区别是什么
这种基础概念题可以说是百考不厌。。。
6. 一个url指向的页面里面有另一个url,最终有一个url指向之前出现过的url或空,这两种情形都定义为null。这样构成一个单链表。给两条这样单链表,判断里面是否存在同样的url。url以亿级计,资源不足以hash。
情形一:两URL链表相交并且无环
情形二:两URL链表相交并且有环
情形三:不相交并且无环
情形四:不相交并且有环
由于题目只要求判断是否存在相同的URL,解法如下:
链表1: 快慢指针各1个
链表2:快慢指针各1个
然后search,在search的过程中,每走一步做这样的检查:
1. 首先判断链表1的慢指针是否等于链表2的快指针,如果相等,则说明存在相同URL
2. 判断两个快指针是否指向NULL,如果都指向NULL,则判断两个慢指针是否相同,如果不同,则继续比较慢指针,因为两条链表相交,最后一个节点肯定是公共的
3. 判断链表1的慢指针是否等于链表1的快指针,链表2的慢指针是否等于链表2的快指针,不存在交叉相等,则两条链表分开且各自有环。
简单的考虑了一下上述情形,感觉还是很麻烦的
7. 数组al[0,mid-1] 和 al[mid,num-1],都分别有序。将其merge成有序数组al[0,num-1],要求空间复杂度O(1)
既然空间复杂度为O(1),那就是原地排序 比如 1 3 5 7 2 4 6 8 indexLeft = 0 indexRight = 4 比较indexLeft和indexRight对应的value,判断大小来决定是否swap、indexLeft是否递增 第一次比较:不需要swap,indexLeft++ 第二次比较:需要swap(a1[leftIndex], a2[rightIndex]),做了swap操作之后,数组的后 半部分可能是无序的,那么对后半部分做swap操作直至其有序 无论是第一次比较还是第二次比较,indexRight都不会改变,重复操作直至indexLeft == indexRight即可 这个时间复杂度O(N2) 是否可以改善呢。。。我们可以看到对于后半部分的保持有序处理过程,只需要二分查找 即可,然后memcpy 复杂度可以降低至O(NlogN) 是否可以降低至O(N),貌似米有特别好的办法8. 百度搜索框的suggestion,比如输入北京,搜索框下面会以北京为前缀,展示“北京爱情故事”、“北京公交”、“北京医院”等等搜索词。
如何设计使得空间和时间复杂度尽量低。
评点:老题,直接上Trie树+Hash
怎么Hash表示还没有想清楚
9. 人搜笔试1. 快排每次以第一个作为主元,问时间复杂度是多少?(O(N*logN))
2. T(N) = N + T(N/2)+T(2N), 问T(N)的时间复杂度是多少? 点评:O(N*logN) or O(N)?
3. 从(0,1)中平均随机出几次才能使得和超过1?(e)
4.编程题:
一棵树的节点定义格式如下:
struct Node{
Node* parent;
Node* firstChild; // 孩子节点
Node* sibling; // 兄弟节点
}
要求非递归遍历该树。
思路:采用队列存储,来遍历节点。
关于第二题,表示还要看一下算法导论。。。
10.有N个节点,每两个节点相邻,每个节点只与2个节点相邻,因此,N个顶点有N-1条边。每一条边上都有权值wi,定义节点i到节点i+1的边为wi。求:不相邻的权值和最大的边的集合。
哎,没搞懂,当N等于4时,有4条边。。。
11. 删除字符串开始及末尾的空白符,并且把数组中间的多个空格(如果有)符转化为1个。
用两个指针就可以搞定
12. 求数组(元素可为正数、负数、0)的最大子序列和。
最长子序列问题:有两种很优雅的解法,都是基础题
13. 链表相邻元素翻转,如a->b->c->d->e->f-g,翻转后变为:b->a->d->c->f->e->g
14. 链表克隆。链表的结构为:
typedef struct list {
int data; //数据字段
list *middle; //指向链表中某任意位置元素(可指向自己)的指针
list *next;//指向链表下一元素
} list;
老题了
15. 100万条数据的数据库查询速度优化问题,解决关键点是:根据主表元素特点,把主表拆分并新建副表,并且利用存储过程保证主副表的数据一致性。(不用写代码)
妈的不用写代码也不知道该怎么做,fuck
16. 求正整数n所有可能的和式的组合(如;4=1+1+1+1、1+1+2、1+3、2+1+1、2+2)
名题百则上题,很多种解法都可以做出来。。。
17. 求旋转数组的最小元素(把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转。输入一个排好序的数组的一个旋转,输出旋转数组的最小元素。例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转,该数组的最小值为1)
老题了
18. 找出两个单链表里交叉的第一个元素
这种题现今不应该再拿出来考了吧
19. 字符串移动(字符串为*号和26个字母的任意组合,把*号都移动到最左侧,把字母移到最右侧并保持相对顺序不变),要求时间和空间复杂度最小
思路:先把*数出来,然后从后向前copy,最后再填上*即可
20. 时间复杂度为O(1),怎么找出一个栈里的最大元素
'?' Matches any single character.
'*' Matches any sequence of characters (including the empty sequence).
The matching should cover the entire input string (not partial).
The function prototype should be:
bool isMatch(const char *s, const char *p)
Some examples:
isMatch("aa","a") → false
isMatch("aa","aa") → true
isMatch("aaa","aa") → false
isMatch("aa", "*") → true
isMatch("aa", "a*") → true
isMatch("ab", "?*") → true
isMatch("aab", "c*a*b") → false
来自:http://blog.csdn.net/hopeztm/article/category/1201028;
比如:abcda和adabc,由于出现的字符个数都是相同,只是顺序不同,
所以这两个字符串是匹配的。要求高效!
在一个平面坐标系上,有两个矩形,它们的边分别平行于X和Y轴。
其中,矩形A已知, ax1(左边), ax2(右边), ay1(top的纵坐标), ay2(bottom纵坐标). 矩形B,类似,就是 bx1, bx2, by1, by2。这些值都是整数就OK了。
要求是,如果矩形没有交集,返回-1, 有交集,返回交集的面积。
int area(rect const& a, rect const& b)
{
...
}
1) 为实现快速查询某用户ID对应的各科成绩,问磁盘文件及内存该如何组织;
2) 改变题目条件,ID为0~10亿之间,且不连续。问磁盘文件及内存该如何组织;
3) 在问题2的基础上,增加一个需求。在查询各科成绩的同时,获取该用户的排名,问磁盘文件及内存该如何组织。
给一个二叉树,每个节点都是正或负整数,如何找到一个子树,它所有节点的和最大?
点评:
@某猛将兄:后序遍历,每一个节点保存左右子树的和加上自己的值。额外一个空间存放最大值。正解,题目比较简单
@陈利人:同学们,如果你面试的是软件工程师的职位,一般面试官会要求你在短时间内写出一个比较整洁的,最好是高效的,没有什么bug的程序。所以,光有算法不够,还得多实践。
写完后序遍历,面试官可能接着与你讨论,a). 如果要求找出只含正数的最大子树,程序该如何修改来实现?b). 假设我们将子树定义为它和它的部分后代,那该如何解决?c). 对于b,加上正数的限制,方案又该如何?总之,一道看似简单的面试题,可能能变换成各种花样。
#include <iostream>
#include <iterator>
#include <algorithm>
#include <vector>
using namespace std;
struct Node
{
Node(int i = 0, Node *pLeft = NULL, Node *pRight = NULL) : data(i), left(pLeft), right(pRight) {}
int data;
Node *left;
Node *right;
};
Node* construct()
{
Node *node15 = new Node(-2);
Node *node14 = new Node(-1);
Node *node13 = new Node(7);
Node *node12 = new Node(6);
Node *node11 = new Node(-10);
Node *node10 = new Node(-5);
Node *node9 = new Node(-1);
Node *node8 = new Node(4);
Node *node7 = new Node(9, node14, node15);
Node *node6 = new Node(-8, node12, node13);
Node *node5 = new Node(6, node10, node11);
Node *node4 = new Node(-2, node8, node9);
Node *node3 = new Node(3, node6, node7);
Node *node2 = new Node(-20, node4, node5);
Node *node1 = new Node(5, node2, node3);
return node1;
}
int findLargestSubTree(Node *root, Node *&subRoot, int &maxSum)
{
if (root == NULL)
return 0;
int leftSum = findLargestSubTree(root->left, subRoot, maxSum);
int rightSum = findLargestSubTree(root->right, subRoot, maxSum);
int totalSum = leftSum + rightSum + root->data;
if (leftSum < rightSum)
{
if (rightSum < totalSum)
{
subRoot = root;
}
}
else
{
if (leftSum < totalSum)
{
subRoot = root;
}
}
maxSum = max(leftSum, max(rightSum, totalSum));
return totalSum;
}
void main()
{
Node *root = construct();
Node *subRoot = NULL;
int sum;
int result = findLargestSubTree(root, subRoot, sum);
cout << "result = " << result << endl;
if (subRoot != NULL)
{
cout << subRoot->data << endl;
cout << "sum = " << sum << endl;
}
}
a). 如果要求找出只含正数的最大子树,程序该如何修改来实现?
即:数组a[]; 对于i < j 且 a[i] > a[j],则称这是一个反序。
给定一个数组,要求写一个函数,计算出这个数组里所有反序的个数。
点评:非简单的全排列问题(跟全排列的形式不同,abc 全排列的话,只有6个不同的输出:http://blog.csdn.net/v_july_v/article/details/6879101)。本题可用递归的思想,设置一个变量表示已输出的个数,然后当个数达到字符串长度时,就输出。
#include <iostream>
#include <iterator>
#include <algorithm>
#include <string>
#include <limits.h>
#include <ctype.h>
#include <vector>
using namespace std;
void printCombine(const char *input, int index, vector<char> cvec)
{
if (index == strlen(input))
{
copy(cvec.begin(), cvec.end(), ostream_iterator<char>(cout, " "));
cout << endl;
return;
}
for (int i = 0; i < strlen(input); i++)
{
cvec.push_back(input[i]);
printCombine(input, index + 1, cvec);
cvec.pop_back();
}
}
void main()
{
vector<char> cvec;
printCombine("abc", 0, cvec);
}
48.
![](https://img-my.csdn.net/uploads/201209/21/1348238412_8250.jpg)
- void fun()
- {
- unsigned int a = 2013;
- int b = -2;
- int c = 0;
- while (a + b > 0)
- {
- a = a + b;
- c++;
- }
- printf("%d", c);
- }
![](https://img-my.csdn.net/uploads/201209/21/1348241937_7105.jpg)
![](https://img-my.csdn.net/uploads/201209/22/1348315032_2201.jpg)
T(n)=1(n<=1),T(n) = 25*T(n/5) + n^2,求算法的时间复杂度。更多题目请参见:http://blog.csdn.net/wonderwander6642/article/details/8008209。
![](https://img-my.csdn.net/uploads/201209/23/1348411683_2316.jpg)
![](https://img-my.csdn.net/uploads/201209/23/1348411415_4328.jpg)
![](https://img-my.csdn.net/uploads/201209/24/1348490795_6874.jpg)
![](https://img-my.csdn.net/uploads/201209/24/1348490806_3995.jpg)
![](https://img-my.csdn.net/uploads/201209/24/1348491579_1619.jpg)
![](https://img-my.csdn.net/uploads/201209/24/1348491639_7448.jpg)
![](https://img-my.csdn.net/uploads/201209/24/1348491629_2449.jpg)
优酷是一家视频网站,每天有上亿的视频被观看,现在公司要请研发人员找出最热门的视频。
该问题的输入可以简化为一个字符串文件,每一行都表示一个视频id,然后要找出出现次数最多的前100个视频id,将其输出,同时输出该视频的出现次数。
1.假设每天的视频播放次数为3亿次,被观看的视频数量为一百万个,每个视频ID的长度为20字节,限定使用的内存为1G。请简述做法,再写代码。
2.假设每个月的视频播放次数为100亿次,被观看的视频数量为1亿,每个视频ID的长度为20字节,一台机器被限定使用的内存为1G。
点评:有关海量数据处理的题目,请到此文中找方法(无论题目形式怎么变,基本方法不变,当然,最最常用的方法是:分而治之/Hash映射 + Hash统计 + 堆/快速/归并排序):http://blog.csdn.net/v_july_v/article/details/7382693。注:上题第二问文件太大,则可如模1000,把整个大文件映射为1000个小文件再处理 ....
3. 链表倒数第n个元素
4. 有一个函数fun能返回0和1两个值,返回0和1的概率都是1/2,问怎么利用这个函数得到另一个函数fun2,使fun2也只能返回0和1,且返回0的概率为1/4,返回1的概率为3/4。(如果返回0的概率为0.3而返回1的概率为0.7呢)
5. 有8个球,其中有7个球的质量相同,另一个与其他球的质量不同(且不知道是比其他球重还是轻),请问在最坏的情况下,最少需要多少次就能找出这个不同质量的球
6. 数据库索引
7. 有一个数组a,设有一个值n。在数组中找到两个元素a[i]和a[j],使得a[i]+a[j]等于n,求出所有满足以上条件的i和j
8. 1万个元素的数组,90%的元素都是1到100的数,10%的元素是101--10000的数,如何高效排序
61. 一场星际争霸比赛,共8个人,每个人的实力用分数表示,要分成两队,如何保证实力最平均?给定一个浮点数的序列,F1,F2,……,Fn(1<=n<=1000),定义P(s,e)为子序列Fi(s<=i<=e)的积,求P的最大值
62. 马路口,30分钟内看到汽车的概率是95%,那么在10分钟内看不到汽车的概率是?
63. 给定一个字符串里面只有"R" "G" "B" 三个字符,请排序,最终结果的顺序是R在前 G中 B在后。
要求:空间复杂度是O(1),且只能遍历一次字符串
64. 人人面试题
1. 实现atoi
2. 单链表变形 如 1 2 3 4 5 变为 1 3 5 4 2 如1 2 3 4 变为 1 3 4 2
3. 二叉树查找不严格小于一个值的最大值(返回节点)。
4. 有序数组里二分查找一个数(如果有相同的找最后一次出现的)。
5. 等价于n*n的矩阵,填写0,1,要求每行每列的都有偶数个1 (没有1也是偶数个),问有多少种方法
65. 数组里找到和最接近于0的两个值
66. 不知啥公司的
1. 行列有序的矩阵查找一个数
2. 直方图最大矩形
3. next_permutation
4. 字符串匹配 含有* ?
5. 实现strcpy memmove
67. hulu的题:
1. 中序遍历二叉树,结果为ABCDEFGH,后序遍历结果为ABEDCHGF,那么前序遍历结果为
2. 对字符串HELL0_HULU中的字符进行二进制编码,使得字符串的编码长度尽可能短,最短长度为
3. 对长度12的有序数组进行二分查找,目标等概率出现在数组的每个位置上,则平均比较次数为
4. 一副扑克(去王),每个人随机的摸两张,则至少需要多少人摸牌,才能保证有两个人抽到同样的花色
5. x个小球中有唯一一个球较轻,用天平秤最少称量y次能找出这个较轻的球,写出y和x的函数表达式y=f(x)
6. 3的方幂及不相等的3的方幂的和排列成递增序列1,3,4,9,10,12,13……,写出数列第300项
7. 无向图G有20条边,有4个度为4的顶点,6个度为3的顶点,其余顶点度小于3,则G有多少个顶点
8. 桶中有M个白球,小明每分钟从桶中随机取出一个球,涂成红色(无论白或红都涂红)再放回,问小明将桶中球全部涂红的期望时间是
9. 煤矿有3000吨煤要拿到市场上卖,有一辆火车可以用来运煤,火车最多能装1000吨煤,且火车本身需要烧煤做动力,每走1公里消耗1吨煤,如何运煤才能使得运到市场的煤最多,最多是多少
10. 1,2,3,4…..n,n个数进栈,有多少种出栈顺序,写出递推公式
11. 宇宙飞船有100,000位的存储空间,其中有一位有故障,现有一种Agent可以用来检测故障,每个Agent可以同时测试任意个位数,若都没有故障,则返回OK,若有一位有故障,则失去响应。如果有无限多个Agent可供使用,每个Agent进行一次检测需要耗费1小时,现在有2个小时时间去找出故障位,问最少使用多少个Agent就能找出故障
12. n个数,找出其中最小的k个数,写出代码,要求最坏情况下的时间复杂度不能高于O(n logk)
13. 写程序输出8皇后问题的所有排列,要求使用非递归的深度优先遍历
68. 有n个作业,a1,a2…..an,作业aj的处理时间为tj,产生的效益为pj,最后完成期限为dj,作业一旦被调度则不能中断,如果作业aj在dj前完成,则获得效益pj,否则无效益。给出最大化效益的作业调度算法
69. 一个是跳台阶问题,可以1次一级,1次两级,1次三级,求N级的跳法一共多少种
70. 一个文件有N个单词,每行一个,其中一个单词出现的次数大于N/2,怎么样才能快速找出这个单词
71. 将一个很长的字符串,分割成一段一段的子字符串,子字符串都是回文字符串。
有回文字符串就输出最长的,没有回文就输出一个一个的字符。
例如:
habbafgh
输出h,abba,f,g,h。