自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 搜索引擎的中文关键字纠错系统 --文章总结

文章1,基于搜索引擎的中文关键字纠错系统--by 任腾飞 原帖:http://wenku.baidu.com/view/3bb055170b4e767f5acfcefa.html一 概述:1 基于搜索引擎的中文关键字纠错系统是基于当前流行的搜索引擎所设计的一个用户帮助系统,它的主要功能是发现用户使用搜索引擎在输入关键字时可能发生的错误,并给向用户推荐可能正确的关键字。纠错系统使用分词与纠错

2012-10-31 12:25:18 6270

转载 AWK-详解著名的awk Oneliner,第三部分:选择性输出特定行

输出文件的前10行(模拟 head -n 10 )awk ' NR 如前所述,这里省略了动作,即为打印输出。匹配模式是变量NR需要小于11,NR即为当前的行号。这个写法很简单,但是有一个问题,在NR大于10的时候,awk其实还是对每行进行了判断,如果文件很大,比如说有上万行,浪费的时间是无法忽略的。所以,更好的写法是awk '1; NR = 10 { exit }' 第一句对当

2012-10-30 22:13:19 6751

转载 stl之容器区别: vector list deque set map

要点总结如下:因此在实际使用时,如何选择这三个容器中哪一个,应根据你的需要而定,一般应遵循下面的原则:1、如果你需要高效的随即存取,而不在乎插入和删除的效率,使用vector2、如果你需要大量的插入和删除,而不关心随即存取,则应使用list3、如果你需要随即存取,而且关心两端数据的插入和删除,则应使用deque stl容器区别: vector list deque se

2012-10-30 12:17:35 680

转载 C++中的static

C++的static有两种用法:面向过程程序设计中的static和面向对象程序设计中的static。前者应用于普通变量和函数,不涉及类;后者主要说明static在类中的作用。面向过程的static1 静态全局变量(可以被整个文件所使用,但是不能在文件意外使用)静态全局变量有以下特点:   该变量在全局数据区分配内存;   未经初始化的静态全局变量会被程序自动初始化为0(在函数体

2012-10-29 16:31:19 611

转载 STL中erase()

erase()函数的功能是用来删除容器中的元素删除某个容器里的某个元素:c.erase(T);看似一个简单的动作,然而对不同类型的容器,内部却做了截然不同的事情,后面介绍。 假设有这样一个题目,将某个容器中所有满足条件N == X的元素删除,按照常规的思路应该有类似这样的代码:// 假设Container和container分别表示一种容器和对应的一个对象Container

2012-10-29 15:26:23 627

原创 (记录)笔试题之语言和程序设计

一 C/C++(1)构造函数可以是内联函数。一般情况下,构造函数比较小的情况下,不管你是否指定其为内联函数,C++编译器会自动将其置为内联,如果函数太大,你即使将其指定为内联函数系统也会不理的。因为这会使程序过大。(2)函数重载:两个或两个以上的函数,具有相同的函数名,但是形参的个数或者类型不同,编译器根据实参和形参的类型及个数进行最佳匹配,自动确定调用哪个函数,这就是函数的重载。

2012-10-29 14:10:00 827

转载 文件夹加密

一  畸形文件夹法(此种方法似乎在win7下失效)  畸形文件夹法是文件夹加密软件常用的方法,如下文中所提到的几款加密软件基本上都采用的该方法。  这种方法的原理就是在磁盘里建立一个畸形文件夹法,加密时将用户文件移动至该文件夹,解密时再移动到原来的位置。由于畸形文件夹法在Windows资源管理中具有“无法删除”,“无法访问”,“无法复制”等特点,所以在一定程度上这种加密方法能够“加

2012-10-29 13:48:13 976

转载 远程控制1-现外网(固定ip)控制内网(无固定ip)

网络遥控技术是指由一部计算机(主控端)去控制另一部计算机(被控端),而且当主控端在控制端时,就如同用户亲自坐在被控端前操作一样,可以执行被控端的应用程序,及使用被控端的系统资源。VNC (Virtual Network Computing)最早是一套由AT&T实验室所开发的可操控远程的计算机的软件,其采用了GPL授权条款,任何人都可免费取得该软件。VNC 软件主要由两个部分组成:VNC ser

2012-10-28 15:31:43 4639

转载 数据挖掘1之简介

数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。1)数据挖掘能做以下七种不同事情  (分析方法):      数据挖掘· 分类 (Classification)   · 估计(Estimatio

2012-10-27 01:00:07 1442

转载 推荐系统之详细介绍

文章摘要: 主要介绍协同过滤推荐系统(cf):一 基于用户的cf二 基于项的的cf三 user CF 对比 item CF (1)适用场景。user CF适合于数据较多而用户固定,例如微博;item CF适合于物品固定,而用户较多,例如购物网站。结合二者,(2)多样性和精度和平衡个人来说,item cf 多样性不好,倾向于推荐相似物品。系统来说,user

2012-10-25 15:24:59 8652 1

转载 推荐算法之协同过滤算法之Slope one

推荐系统最早在亚马逊的网站上应用,根据以往用户的购买行为,推荐出购买某种产品同时可能购买的其他产品,国内做的不错的当当网,有时候买书,它总能给我推荐出我感兴趣的其他书来,也算是技术极大的促进了销售。一般的协同过滤算法,首先是收集用户对事物(产品)的评分情况,一种直接对某本书,或者某个歌曲打分,另种是隐性的打分,比如商务系统中,购买了表示打2分,浏览了打1分,其他的0分。我比较看好隐性打分,

2012-10-25 13:43:04 1867

转载 75道逻辑思维题

75道逻辑思维题-------会作10道智商就是正常,会作30道就不是凡人,会作60道就是高智商稀有人才了!2010-02-03 17:08 | (分类:竹马的世界)【1】假设有一个池塘,里面有无穷多的水。现有2个空水壶,容积分别为5升和6升。问题是如何只用这2个水壶从池塘里取得3升的水。【2】周雯的妈妈是豫林水泥厂的化验员。 一天,周雯来到化验室做作业。做完后想出去玩。 "等等,

2012-10-23 22:44:30 5726

转载 并行编程之跨平台使用SSE、AVX指令集心得——以单精度浮点数组求和为例(支持vc、gcc,兼容Windows、Linux、Mac)

作者:zyl910。  本文面对对SSE等SIMD指令集有一定基础的读者,以单精度浮点数组求和为例演示了如何跨平台使用SSE、AVX指令集。因使用了stdint、zintrin、ccpuid这三个模块,可以完全避免手工编写汇编代码,具有很高可移植性。支持vc、gcc编译器,在Windows、Linux、Mac这三大平台上成功运行。一、问题背景  最初,我们只能使用汇编语言来编写SI

2012-10-23 17:07:07 8126 2

转载 文艺程序员的好妹子--google总裁

Google美女总裁:只跟聪明人在一起她聪明绝顶,才华过人,年纪轻轻就成为Google的核心人物;她金发碧眼,相貌出众,常常是各大媒体竞相追逐的对象;她曾被《新闻周刊》称为“当代最有权力的女性之一”;她就是Google的副总裁玛丽莎·梅耶尔(Marissa Mayer),一个谜一般的女人!By Julian Guthrie编译 袁海鹰   还有一周就是圣诞节了,玛丽莎·梅耶尔(Mari

2012-10-23 13:20:15 2126

原创 字符串之输出所有字母组合相同的单词

有个题目,就是给你100W个字典顺序的单词,让输出所有字母组成相同的单词,比如post,stop,pots。 我的方法是: hash映射 视为26进制数  每个计算hash值 然后找出其它种组合的哈希值看是否存在剪枝的策略 是如过进行到后边,不查询前边的例如stop 那么不查询post或者pots 因为p这样是O(N)?一般的方法好像是《编程珠玑》上的w

2012-10-21 23:38:52 3391

原创 数论之不用除法运算,如何实现A/3

这是一道填空题一 除法等于减法。 (1)一般的想法是:循环减去3(2)我的想法是:从高位到低位,每一位减去3。a  位置I上的字符是a[i],则   j=a[i]mod3得到j ,那么这表示有j*10^i个3。a[i]=a[i]-3*j.     同理求的所有位置代表的数含有的3。b   如某一位剩余1或者2则变成10或者20加到下一位去,进入步骤a下面几种算法

2012-10-21 23:23:08 1058

原创 安全公司笔试面试题总结

一IP地址(注意地址范围和私有地址的定义)IP地址分为五类,A类保留给政府机构,B类分配给中等规模的公司,C类分配给任何需要的人,D类用于组播,E类用于实验,各类可容纳的地址数目不同。  A、B、C三类IP地址的特征:当将IP地址写成二进制形式时,A类地址的第一位总是0,B类地址的前两位总是10,C类地址的前三位总是110。A类地址  (1)A类地址第1字节为网络地址,其它3个

2012-10-21 23:13:58 1455

转载 加密算法总结

加密技术通常分为两大类:“对称式”和“非对称式”。 对称式加密就是加密和解密使用同一个密钥。DES  非对称式加密就是加密和解密所使用的不是同一个密钥,通常有两个密钥,称为“公钥”和“私钥”,它们两个必需配对使用,否则不能打开加密文件。这里的“公钥”是指可以对外公布的,“私钥”则不能,只能由持有人一个人知道。它的优越性就在这里,因为对称式的加密方法如果是在网络上传输加密文件就很难把

2012-10-21 22:51:59 1763 1

转载 排列组合之字符串的全排列和组合算法

全排列在笔试面试中很热门,因为它难度适中,既可以考察递归实现,又能进一步考察非递归的实现,便于区分出考生的水平。所以在百度和迅雷的校园招聘以及程序员和软件设计师的考试中都考到了,因此本文对全排列作下总结帮助大家更好的学习和理解。对本文有任何补充之处,欢迎大家指出。首先来看看题目是如何要求的(百度迅雷校招笔试题)。一、字符串的排列用C++写一个函数, 如 Foo(const char *

2012-10-21 12:41:44 1003

转载 离散数学之鸽巢原理

抽屉原则大家知道,两个抽屉要放置三只苹果,那么一定有两只苹果放在同一个抽屉里,更一般地说,只要被放置的苹果数比抽屉数目大,就一定会有两只或更多只的苹果放进同一个抽屉,可不要小看这一简单事实,它包含着一个重要而又十分基本的原则——抽屉原则.1.  抽屉原则有几种最常见的形式原则1 如果把n+k(k≥1)个物体放进n只抽屉里,则至少有一只抽屉要放进两个或

2012-10-17 11:17:24 5746

转载 查找之找出N个整数中最大的K个数

题目一:找出N个整数中第K大的数类似下边的类快排算法,递归实现,应该可以,需要验证一下。平均复杂度O(n).题目二:找出N个整数中最大的K个数两个比较好的解法:O(nlogk)1快排和递归【解法二】回忆一下快速排序,快排中的每一步,都是将待排数据分做两组,其中一组的数据的任何一个数都比另一组中的任何一个大,然后再对两组分别做类似的操作

2012-10-17 10:55:53 2319

转载 字符串之字符串左旋

参考自:http://blog.csdn.net/v_july_v/article/details/6322882左旋转字符串  * 题目:定义字符串的左旋转操作:把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n),辅助

2012-10-17 00:48:41 1654

原创 随机算法--之等概率生成器

已知随机函数old_rand(),以p的概率产生0,以1-p的概率产生1,//现在要求设计一个新的随机函数newRand(),使其以等概率生成1和0   我当时用的是求异或,对此之后概率值最终会收敛到0.5,0.5。正确答案是:http://www.51projob.com/a/souhu/20120911/651.html[cpp] view plainc

2012-10-13 22:26:59 1615

转载 字符串匹配之通配符问题------一串首尾相连的珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。

原帖:http://blog.csdn.net/godcupid/article/details/6557544,原帖有源码一串首尾相连的珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。并分析时间复杂度与空间复杂度。这道题在网上著名的帖子微软等公司数据结构+算法面试100题系列 有详细的描述,算法思想好像是此题犹如在一个长

2012-10-11 23:37:17 2796

转载 设计包含min函数的栈,O(1)空间实现方法

原址:http://blog.csdn.net/anchor89/article/details/6055412#comments 题目:定义栈的数据结构,要求添加一个min函数,能够得到栈的最小元素。要求函数min、push以及pop的时间复杂度都是O(1)。注:这是06年一道Google的面试题.先来说个常规解和他的一个优化,常规解的时间复杂度符合要求,但需要线性的

2012-10-11 23:18:44 1160

转载 随机数算法之从N个数中取M个数

算法描述如下:从M个数中选出N个数来(0分两种情况:1.n>>m时  repeat         Randomize;                   //初始化随机数         a:=Random(n-1)+1;     //如果n=50,0         b:=Random(n-1)+1;         c:=Random(n-1)+1;

2012-10-11 21:08:52 4818

原创 sizeof和strlen

总结一下这两个的用法,发现还挺多。重点:1 sizeof和strlen的区别2 结构体中数据对齐的法则    1) 结构体每个成员相对于结构体首地址的偏移量都是(这个)成员大小的整数倍,如有需要编译器会在成员之间加上填充字节(internal padding); 2) 结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节(trail

2012-10-11 13:15:16 671

转载 快排的非递归算法

源地址:http://blog.sina.com.cn/s/blog_49458c270100nkm4.htmlhttp://hex.iteye.com/blog/777858算法之非递归的快速排序 (2010-12-11 20:32:40)转载▼标签: 算法 快速排序 非递归

2012-10-11 00:36:31 660

转载 随机数算法----根据概率取随机数

原帖:http://hi.baidu.com/horseluke/blog/item/d4a1be268a7fec1c8a82a1fc.html 第一种:数组填充第二种:线段法第三种:没看懂PHP,希望网友能赐教。。。houlai:设随机抽到A的概率为0.1,B的概率为0.2,C的概率为0.3,D的概率为0.4,现在求按此概率随机抽出一个字母的算法当时自

2012-10-11 00:04:43 3014

转载 随机算法1之概率算法

原帖:http://www.cnblogs.com/chinazhangjie/archive/2010/11/11/1874924.html一、随机数   随机数在概率算法设计中扮演着十分重要的角色。在现实计算机上无法产生真正的随机数,因此在概率算法中使用的随机数都是一定程度上随机的,即伪随机数。线性同余法是产生伪随机数的最常用的方法。由线性同余法产生的随机序列a0,a1,…,an满

2012-10-10 22:59:24 2044

原创 IT公司笔经面经

师兄说,你写笔试日记没?写笔试日记是一个好的总结,可以学到东西。 这一段遭遇的打击表明必须认真对待找工作这件事了。 言归正传。 笔经 (1)10.10 网易游戏笔试 笔了3个小时,共20页。试卷1是决定及格线,试卷2决定名次。 试卷1并没有答的很好,说明基础不牢。基本上是语言和数据结构,操作系统和网络大约两道。//看完面试宝典。试卷2里面都是大题。问题出在概率题

2012-10-10 22:24:14 1623

转载 一些常识--大部分IT人不知道

我给出了一些解释。原地址:http://blog.csdn.net/yuankaining/article/details/5692749HDD的C:盘比D:盘快LCD的黑屏和白屏几乎一样费电。//黑屏比白屏还要耗电,而CRT相反。Cache大了不保证CPU更快CPU和compiler相互影响设计方案32位机可以管理超过4G的地址(数据总线和地址总线是两回事儿)虚拟机技术的流行

2012-10-09 22:49:29 661

转载 查找----二维数组的查找之杨氏矩阵

原帖在此;http://blog.csdn.net/michealmeng555/article/details/2489923算法研讨的论文【原创分享】杨氏矩阵 Young Tableau前几天算法课上老师提到了一个数据结构--Young Tableau,只是简单的提了一下,没有仔细的讲解,于是自己在网上搜集了一些资料,并且加以研究,感觉杨氏矩阵(Young Tableau)是一个很

2012-10-09 22:42:00 890

原创 排序2------计数排序,桶排序

稍后整理基数排序当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 Θ(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。由于用来计数的数组C的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。例如:计数排序是用来排序0到100之间的数字的最好的算法

2012-10-09 22:35:37 711

转载 字符串---字符串匹配KMP算法

http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.htmlhttp://www.cppblog.com/oosky/archive/2006/07/06/9486.htmlhttp://www.matrix67.com/blog/archives/115/

2012-10-08 21:56:19 502

转载 windows Concurrency Runtime---windows的并行编程模型

原来还以为是一个多任务调度。最终发现类似于openmp或者 Windows thread pool 。Overview of the Concurrency Runtime(微软的并发运行时) This document provides an overview of the Concurrency Runtime. It describes t

2012-10-08 14:28:35 1488

转载 用GNU profiler提高代码运行速度

总结本文:一  使用gprof的使用方法:1使用time 命令获得程序在用户空间和系统调用的时间对比2若是用户空间时间较长,则使用gprof优化。3编译,查看结果flat profile和call graph.二  gprof 的最大缺陷:它只能分析应用程序在运行 过程中所消耗掉的用户 时间。通常来说,应用程序在运行时既要花费一些时间来运行用户代码,也要花费

2012-10-08 13:13:54 832

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除