- 博客(67)
- 收藏
- 关注
原创 整数建散列表
#include #include #include#includeusing namespace std;typedef struct Hash_Node { int data; int count; Hash_Node * next;}node; #define HASH_SIZE 1024node *hash_ta
2012-12-31 21:08:46 333
原创 单向链表操作
#include #include #include#includeusing namespace std;typedef struct Node{ int data; Node * next; }node;void print(node *head) { node *p = head; whil
2012-12-31 20:24:09 238
转载 内存布局
静态区:保存自动全局变量和static 变量(包括static 全局和局部变量)。静态区的内容在总个程序的生命周期内都存在,由编译器在编译的时候分配。栈:保存局部变量。栈上的内容只在函数的范围内存在,当函数运行结束,这些内容也会自动被销毁。其特点是效率高,但空间大小有限。堆:由malloc 系列函数或new 操作符分配的内存。其生命周期由free 或delete 决定。在没
2012-12-31 17:45:05 240
原创 c 局部申请内存
#include #include using namespace std;void GetMemory(char **p, int num) { *p = (char*)malloc(num*sizeof(char)); }char * GetMemory2(char *p,int num) { p = (char*)mallo
2012-12-31 17:37:15 404
转载 Trie树:应用于统计和排序
http://blog.csdn.net/hguisu/article/details/8131559 1. 什么是trie树 1.Trie树 Trie树,又称单词查找树、字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树结构。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最
2012-12-30 23:05:37 321
转载 从头到尾彻底解析Hash 表算法
http://blog.csdn.net/v_JULY_v/article/details/6256463作者:July、wuliming、pkuoliver 出处:http://blog.csdn.net/v_JULY_v。 说明:本文分为三部分内容, 第一部分为一道百度面试题Top K算法的详解;第二部分为关于Hash表算法的详细阐述;第三部分为打造一个最
2012-12-30 22:52:43 385
转载 十道海量数据处理面试题
http://blog.csdn.net/v_JULY_v/article/details/62794981、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个
2012-12-30 22:49:49 407
转载 统计出现次数最多的数据
http://blog.csdn.net/v_july_v/article/details/6403777#comments题目描述:给你上千万或上亿数据(有重复),统计其中出现次数最多的前N个数据。 分析:上千万或上亿的数据,现在的机器的内存应该能存下(也许可以,也许不可以)。所以考虑采用hash_map/搜索二叉树/红黑树等来进行统计次数。然后就是取出前N个出现次
2012-12-30 22:46:14 6320 1
转载 Top K算法问题的实现
http://blog.csdn.net/v_july_v/article/details/6403777#comments//copyright@yansha &&July //July、updated,2011.05.08 //题目描述: //搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的 //长度为1-255字节。假设目前
2012-12-30 22:39:38 475
原创 ip count
1.ip.shBEGIN{ #print "start counting ip";{ip[$1]++;}END{ for(i in ip){ print ip[i]," ", i }}awk -f ip.sh ip.txt | sort -rn -k 12 129.0.0.12 128.0.0.1
2012-12-30 10:18:10 369
转载 .Google PageRank 算法
1.1、PageRank(网页级别)的概念 互联网发展早期的搜索引擎,对web页面的排序,是根据搜索的词组(短语)在页面中的出现次数(occurence ),并用页面长度和html标签的重要性提示等进行权重修订。链接名气(link popularity)技术通过其它文档链接到当前页面(inbound links)的链接数量来决定当前页的重要性,这样可以有效地抵制被人为加工的页面欺骗搜索引
2012-12-29 23:37:40 554
转载 开发者都应该知道的开源搜索引擎
本文介绍若干款开源搜索引擎,他们具有不同的特性,总之都很强大。对于开发者来说,应该了解。 1、企业搜索解决方案 Constellio Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 本文介绍若干款开源搜索引擎,他们具有不同的特性,总之都很强大。对于开
2012-12-29 23:32:21 565
原创 centos 6 install nginx php
1 准备 yum -y install make openssl openssl-devel pcre pcre-devel libpng libpng-devel libjpeg-6b libjpeg-devel-6b freetype freetype-devel gd gd-devel zlib zlib-devel gcc gcc-c++ libXpm libXpm-devel ncur
2012-12-29 20:45:23 336
转载 开启gzip压缩传输
最近无事研究一些Web的优化,用工具page speed检测网站时发现还没有开启gzip压缩,于是上网找来资料实验一下;在apache2.0以上(包括apache2.0)的版中gzip压缩使用的是mod_deflate模块,下面是具体配置步骤第1步LoadModule deflate_module modules/mod_deflate.soLoadModule headers_mo
2012-12-27 19:43:35 607
转载 最大公共子序列
好久没搞算法了,温习下问题的递归式写成:回溯输出最长公共子序列过程: 算法分析:由于每次调用至少向上或向左(或向上向左同时)移动一步,故最多调用(m + n)次就会遇到i = 0或j = 0的情况,此时开始返回。返回时与递归调用时方向相反,步数相同,故算法时间复杂度为Θ(m + n)。
2012-12-27 17:19:27 247
转载 simple multithreaded
/****************************************************************** * simple.c -- multithreaded "hello world" * * Author: Mark Hays *//* Linux with glibc: * _REENTRANT to grab thread-safe li
2012-12-27 09:02:40 259
转载 tcp/udp Socket图解
tcp协议和udp协议的差别比较项TCPUDP是否连接面向连接面向非连接传输可靠性可靠的不可靠的应用场合大量数据少量数据速度慢快
2012-12-26 23:02:09 526
转载 网络协议
网络中的计算机与终端间要想正确的传送信息和数据,必须在数据传输的顺序、数据的格式及内容等方面有一个约定或规则,这种约定或规则称做协议。网络协议主要有三个组成部分: 1、语义: 是对协议元素的含义进行解释,不同类型的协议元素所规定的语义是不同的。例如需要发出何种控制信息、完成何种动作及得到的响应等。 2、语法: 将若干个协议元素和数据组合在一起用来表达一个完整的内容所应遵循的格式,也
2012-12-26 21:27:08 405
转载 Linux Socket编程
我们深谙信息交流的价值,那网络中进程之间如何通信,如我们每天打开浏览器浏览网页时,浏览器的进程怎么与web服务器通信的?当你用QQ聊天时,QQ进程怎么与服务器或你好友所在的QQ进程通信?这些都得靠socket?那什么是socket?socket的类型有哪些?还有socket的基本函数,这些都是本文想介绍的。本文的主要内容如下:1、网络中进程之间如何通信?2、Socket是什么?
2012-12-26 21:22:16 267
转载 客户/服务器模式
客户/服务器模式过程中采取的是主动请求方式: 首先服务器方要先启动,并根据请求提供相应服务: 1. 打开一通信通道并告知本地主机,它愿意在某一公认地址上(周知口,如FTP为21)接收客户请求; 2. 等待客户请求到达该端口; 3. 接收到重复服务请求,处理该请求并发送应答信号。接收到并发服务请求,要激活一新进程来处理这个客户请求(如UNIX系
2012-12-26 21:18:35 2710
转载 TCP协议三次握手过程分析
TCP(Transmission Control Protocol) 传输控制协议TCP是主机对主机层的传输控制协议,提供可靠的连接服务,采用三次握手确认建立一个连接:位码即tcp标志位,有6种标示:SYN(synchronous建立联机) ACK(acknowledgement 确认) PSH(push传送) FIN(finish结束) RST(reset重置) URG(urgent紧急
2012-12-26 21:08:19 390
原创 如何判断一个整数数组中是否有重复元素
写一个函数判断一个int类型的数组是否是有效的。 所谓有效是指:假设数组大小为n,那么这个int数组里的值为0~n-1之间的数,并且每个数只能出现一次,否则就是无效数组典型的空间换时间 开个大数组,遍历一遍,每次数量加1,若加前不为0就不是void output(int *arr, int num) { for(int i=0;i cout
2012-12-26 21:03:07 3178 1
原创 二分求两边单调性相反的数组的最大值
给定一个数组a[0~n-1],前面部分是严格单调递增,后面部分是严格单调递减(所以存在最大值),求最大值和它的索引(下标)int maxmum(int *arr,int left,int right) { if(right-left return arr[left]>arr[right] ? arr[left] : arr[right]; }
2012-12-26 20:03:48 512
原创 产生随机整数序列
void generate(int *arr,int num) { srand((int)time(0)); for(int i= 0; i arr[i] = rand(); }}
2012-12-26 19:52:54 507
转载 Comet:基于 HTTP 长连接的“服务器推”技术
使用 HTTP 长连接、无须浏览器安装插件的两种“服务器推”方案http://www.ibm.com/developerworks/cn/web/wa-lo-comet/
2012-12-26 10:11:26 283
原创 圣诞聚餐
今晚和3个朋友聚餐,喝了几杯啤酒,酒逢知己千杯少啊,聊得很high,工作,感情,生活,有时要学会享受,你会发现自己真的有很大的提升。。。
2012-12-25 22:30:51 317
原创 腾讯的美女频道很给力呀,你也来看看
http://c.t.qq.com/i/43?pgv_ref=web.c.page.nav.tree.level1 ,各种pose,应接不暇,看看饱眼福。
2012-12-24 14:06:19 444
转载 Object-Oriented JavaScript
JavaScript is object-oriented programming language. We can define some object structure for our use.Every object in JavaScript is an instance of the object Object and therefore inherits all it
2012-12-24 13:52:28 368
原创 klondike solitair
html5 的canvas 游戏,效果很棒,http://klondike.solitaire-online-games.com/。
2012-12-24 11:59:52 306
原创 php socket
$fp = fsockopen("www.baidu.com",80,$errno,$errstr,30);if($fp) { $out = "GET / HTTP/1.1\r\n"; $out .= "Host: www.baidu.com"; $out .= "Connection: Close\r\n\r\n"; fwrite($fp, $out)
2012-12-23 23:00:29 224
原创 Active Record
//the Active Record pattern is the simplest of the database-related design patterns. The//Active Record pattern embeds the knowledge of how to interact with the database directly into the class perf
2012-12-23 22:57:17 283
原创 Monostate
class Monostate { // 属于类不属于对象 private static $_val = 0; public function Monostate(){ } public function set($val) { self::$_val = $val; } pu
2012-12-23 22:55:41 363
原创 value object
//1. Protect the attributes of a Value Object so direct access is forbidden.//2. Set the object’s attributes in the constructor.//3. Provide no “setter” functions, which otherwise allow attributes
2012-12-23 22:55:15 309
原创 Registry
//one to find the Registry and one to//find the object associated with the key. class Registry { public $store = array(); public function is_valid($key) { return array_key_e
2012-12-23 22:54:16 279
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人