自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Rockics的专栏

吾尝终日而思矣,不如须臾之所学也

  • 博客(42)
  • 收藏
  • 关注

翻译 【全文完】【Deep C (and C++)】深入理解C/C++(4)

译自Deep C (and C++) by Olve Maudal and Jon Jagger,本身半桶水不到,如果哪位网友发现有错,留言指出吧:) 总结一下第三讲,我们可以知道,相对于第一位候选者,第二位候选者在以下几个方面有更深的认识:1、  C与C++的联系;2、  多态方面的技术;3、  如何正确的初始化一个对象;4、  Rule of three;5、  操

2011-12-03 18:04:38 4962 14

翻译 【Deep C (and C++)】深入理解C/C++(3)

译自Deep C (and C++) by Olve Maudal and Jon Jagger,本身半桶水不到,如果哪位网友发现有错,留言指出吧:) 第二位候选者表现不错,那么,相比大多数程序员,他还有什么潜力没有被挖掘呢?可以从以下几个角度去考察:有关平台的问题—32位与64位的编程经验;内存对齐;CPU以及内存优化;C语言的精髓; 接下来,主要分享一下以下

2011-12-02 21:14:34 5424 8

原创 【陷阱】你能用几种方法交换两个变量的值?

<!--@page {margin:2cm}p {margin-bottom:0.21cm}-->找工作的时候,笔试,面试阶段,我们经常看到这么一道题:不用临时变量,如何交换两个变量的值?很多同学不假思索,写下如下代码:#include int swap1(int *a, int *b){ *a = *a+*b; *b

2011-11-30 17:17:49 3887 5

翻译 【Deep C (and C++)】深入理解C/C++(2)

译自Deep C (and C++) by Olve Maudal and Jon Jagger,本身半桶水不到,如果哪位网友发现有错,留言指出吧:)          好,接着深入理解C/C++之旅。我在翻译第一篇的时候,自己是学到不不少东西,因此打算将这整个ppt翻译完毕。 请看下面的代码片段:#include void foo(void){ int a;

2011-11-28 10:17:09 26553 19

翻译 【Deep C (and C++)】深入理解C/C++(1)

译自Deep C (and C++) by Olve Maudal and Jon Jagger,本身半桶水不到,如果哪位网友发现有错,留言指出吧:) 编程是困难的,正确的使用C/C++编程尤其困难。确实,不管是C还是C++,很难看到那种良好定义并且编写规范的代码。为什么专业的程序员写出这样的代码?因为绝大部分程序员都没有深刻的理解他们所使用的语言。他们对语言的把握,有时他们知道某些东西未

2011-11-26 17:38:48 8205 7

原创 linux 命令行换行问题

过长的单行命令,需要进行换行,都知道需要使用 \ 来达到目的,但是昨晚的三封监控邮件没有按时发出,检查了一下,发现就是换行问题,要进行换行的时候,你需要注意那个 \的颜色问题。按照这样的模式换行吧:空格 斜杠 回车 继续命令:)

2011-07-07 09:55:36 17014

原创 vimrc的路径在哪里?要非常关心编码问题,编码坑爹呀

内容基本上来自:  http://hi.baidu.com/susefans/blog/item/d614812b8c7c35f0e6cd40f5.htmlLinux、MAC下的全局目录是在/usr/vim/share/vim目录中·用户的话,得改 ${HOME}/.vimrc最好为每个用户或者为自己的用户单独配置一个,可以这样做:debian:~# cp /usr/share/v

2011-06-29 11:44:00 11224

原创 海量数据中随机抽查K个样本 算法

现在做爬虫阶段的数据分析,需要针对每一个站点随机抽检K个url,那么,如何从巨大数量的url中做到随机抽检呢?url的总数是不知道的,当然你可以扫描两次,第一次得到url总是,但是,有更好的做法。 (哈哈,我要无耻的说 原创 转帖标签不好看 :)) 以下引用来自:http://wansishuang.iteye.com/blog/443902要求从N个元素中随机的抽取k个元

2011-06-24 17:06:00 4032

转载 time--shell保留字输出无法重定向解决

原文 作者:good bai    mail: [email protected]原文请看:http://blogold.chinaunix.net/u3/104336/showart_2060136.html 话说time是一个bash的保留字。别人这样讲,但是我没有看出来是为什么这样讲,经查time命令是time包中的一个文件。我不知道这样讲(保留字)的目的,但是运行测试,

2011-06-23 17:44:00 3926 1

原创 临时笔记

SPT-下载爬虫系统和数据分析(7370)职位描述:   岗位职责:负责搜索引擎爬虫系统的开发及相关数据的分析挖掘岗位要求:2年以上c 编程经验,对算法/数据结构有深刻理解熟悉linux编程和调试环境熟悉 socket 网络编程具备良好的团队协作能力及沟通能力有大型分布式系统设计开发经验优先有搜索引擎经验者优先具有数据挖掘、自然语

2011-06-15 18:05:00 2926

原创 zipfian分布

zipf law:在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和freq的乘积大致是一个常数。 It is known that the number of incoming links to pages on the Web follows a Zipfian distribution. That is, a small number of Web pa

2011-06-14 16:18:00 8154

原创 并行爬虫设计相关1

挑战: 1.如何避免重复性。不同的处理线程(进程)如何协调,使得不重复下载页面。2.网页质量。每一个处理进程,如何能过全局的考虑网页的质量,因为他们彼此之间不知道对方存在,所以进程间了解的网页重要性有局部性。3.通信带宽。为了解决上述问题,进程间需要通信,然而随着规模的加大,通信花销也变得异常的大。  如果解决了上述问题,则并行爬虫要比单个爬虫更有诱惑力:1.可扩展

2011-06-14 14:48:00 2990

原创 请使用ulld格式打印uint64_t的数据

这两行代码 输出的g_randeven严重不一样 :fprintf(stderr,"odd count : %ld/t even count : %ld/n",g_randodd,g_randeven);cout 使用ld打印会出错,因为g_randodd还有g_randeven都是64位的。大端表示法等等相关知识回忆一下。

2011-06-10 14:34:00 12882

原创 关于curl,关于url分析

leader需要我从海量的url中选取url最多的1000个站点,每个站点再随机抽取100个url,分析url的质量,这里的质量,就是指是否死链,是否全部广告之类的 是否死链只要使用浏览器打开看看就OK了 然而 1000乘以100 ,一个一个去做的话,显然太傻,于是我使用了curl写个程序去获取http的头部信息,统计返回来的的状态码,程序再跑,可是异常的慢,现在终于明白为什么爬虫不可能使

2011-06-09 12:34:00 4170

原创 larbin跑起来了,下一步就是阅读代码了

03年的代码就是不好编译通过,即使现在larbin跑起来了,还是出现很多的警告 首先在下载larbin源代码。我下载的版本是larbin2.6.3 第一步: 注释adns目录下的internal.h的569到571行 第二步:到iostream的目录下复制一份到同一目录,文件名iostream.h,也就是说,iostream在什么目录,iostream.h就在什么目录 

2011-06-03 22:37:00 3315

原创 gdb使用记录

1.记得在编译的时候使用 -g 选项 2.l   列出源代码 3.break 行数    设置断点 4.r  执行 5.n 下一步  单步执行 6.c 继续 遇到一个问题,就是gdb a.out 不知道怎么给可执行文件添加参数,这个只要使用  set args就可以了,也是gdb的命令 p  打印变量的值 bt 查看栈信息

2011-06-03 18:14:00 2775

原创 今天晚上要把larbin运行起来

晚上事情感觉还是蛮多的,下班先去定个房间,老婆要来北京。然后还要给大妈电话,说服她使用qq游戏,晚上主要是配置编译larbin,争取运行起来。好像还要洗衣服,查询明天出行路线之类的。 昨天晚上死活编译不过去,有点阴影。现在把查到的可能的解决方案记录一下,晚上逐一试验。 生活就是折腾,技术就是实践。 懒得全文拷贝了,复制url更妙; http://hi.baidu.c

2011-06-03 17:08:00 3000

原创 makefile规则学习一

makefile文件主要规定了make工具的依赖关系 makefile文件中可以定义变量varname,并且使用$(varname)进行引用,有点类似于C语言中的宏定义 make工具的自动推导过程,也就是所谓的make的“隐晦规则”,亦即,如果目标文件时name.o,那么name.c文件就会被默认推导为name.o文件的依赖文件 清空目标文件规则,每个makefile文件都

2011-06-03 15:27:00 2859

原创 makedepend是个工具居然

<br />我原来不知道<br /> <br /> 编译larbin的时候configure阶段出现很多错误<br /> <br />幸亏 同事 高明  一语道破天机 <br /> <br />这居然是个工具 安装之  哈哈  我在超超的电脑上操作 幸好这哥们的root帐号密码简单 容易破解

2011-06-02 23:43:00 5782

原创 fopen创建文件失败

<br />当以 w 模式使用fopen的时候,当前不存在要打开的文件,此时断言流出错失败,于是去怀疑fopen是否真的可以创建文件,有点搞笑。<br /> <br />看到一句话,fopen此时尝试创建文件,不保证成功。<br /> <br />我在使用的时候,创建文件失败,其实是因为进程所在组最当前目录没有相应权限,<br /> <br />简单的设置一下权限以后,可以创建文件了。<br /> <br />特此记录。

2011-06-02 17:11:00 12358 3

原创 C++ 注意检查迭代器是否有效

今天遇到一个问题,在写一个文件的时候,不时的遇到 段错误 这个问题,自己第一反应时使用fprintf写文件,文件大小有限制,但是没有找到相关的说法。还是仔细检查了自己的代码,发现没有对之前的一个迭代器进行有效性判断就使用了,据此打印了一下log信息,发现果真是这地方出了问题。以后写代码,不要想当然的认为迭代器管用,一定要做检查,记住了。

2011-06-02 15:42:00 5349 1

转载 fread 和 read函数的区别

转自  http://tystudio.blog.163.com/blog/static/142018232009382397422/1,fread是带缓冲的,read不带缓冲. 2,fopen是标准c里定义的,open是POSIX中定义的. 3,fread可以读一个结构.read在linux/unix中读二进制与普通文件没有区别.

2011-05-08 15:34:00 1268

原创 编译spserver-0.9.5手记

首先要到spserver目录下,至于其他的,ssl之类的,我先不管了。阅读README,按照说明修改MAKEFILE中关于libevent共享库的路径,在当前目录下,make报错,如下:spioutils.cpp: 在静态成员函数‘static int SP_IOUtils::tcpListen(const char*, int*, int, int)’中:spioutils.cpp:201:39: 错误:‘fchmod’在此作用域中尚未声明

2011-04-30 02:03:00 4510 2

原创 Linux命令使用记录

<br />1.需要在某个文件夹下查找含有字符fchmod的文件:<br />grep fchmod . -r  <br />这命令表示在当前目录下查找看有字符串fchmod的文件<br />----------------------------------------------------------------------------------------------------------------------

2011-04-30 01:49:00 827

原创 fedora安装HTTPSQS所遇各种问题解决汇总

最近在研究张宴的基于 HTTP GET/POST 协议的轻量级开源简单消息队列服务HTTPSQS,安装阶段遇到如下错误汇总如下:安装tokyocabinet时./configure会出现如下错误:    configure: error: bzlib.h is required.这是因为bzlib.h找不到的错误,在fedora下是bzip2-devel没有安装,用yum 安装就好了yum install bzip-devel 解决了。

2011-04-26 16:43:00 2476

原创 如何找出频率超过一半的数?

问题描述:据说腾讯这次笔试题java部分出了这么一道题:某男人的聊天记录都是与女人发生的,其中有一位的聊天记录超过半数,找出她来,潜在的第三者。其实这道题也就是要找出频率找过一半得数。

2011-04-26 15:33:00 1129 5

转载 C++引用与指针的比较

转帖自:http://www.cnblogs.com/kingln/archive/2008/03/29/1129118.html引用是C++中的概念,初学者容易把引用和指针混淆一起。

2011-04-26 11:25:00 915

原创 乱谈计算机、转专业、考研

作者:Rockics(http://blog.csdn.net/Rockics  )转载请注明出处既然是漫谈,那就是没有很好的组织,想到什么谈什么。也许有网友说了,IT民工真的那么好么?正所谓萝卜白菜,各有所好。我真告诉你说,我真的很喜欢这个行业,真的很享受看到自己冥思苦想的结果在计算机上跑起来的那种感觉,你相信么?我估计你也是嗤之以鼻,但是事实是:我真的很享受。开头这么一说,主要就是表明,本文不打算过多讨论计算机这专业好与不好,我也说不清。全凭感受吧。前段时间到了百度实习以后,有一次跟老婆聊起来说:多亏了

2011-04-03 10:35:00 6905 12

原创 C语言内存管理

C语言的学习难点在于内存管理和指针,我打算先攻克内存管理,这些文章,主要是从网上找资料看,加上自己的一些理解,贴出来,一是自己方便,二是希望可以得到大家的指教。

2011-04-02 23:06:00 2006

原创 算法学习笔记(3)——分治法,Fibonacci数列,Strassen算法

作者:Rockics(http://blog.csdn.net/Rockics )转载请注明出处本课的主讲是Erik,讲了算法设计中特别重要的思想之一:分治法。好好体会这一课的精华。由于本人英文水平太差,这一课前前后后加起来的时间差不多一天。最后的VLSI问题还是没有听的太明白?求什么?

2011-04-02 17:33:00 2331 2

转载 关于Fibonacci数列

1202年,義大利數學家斐波那契出版了他的「算盤全書」。他在書中提出了一個關於兔子繁殖的問題: 如果一對兔子每月能生一對小兔(一雄一雌),而每對小兔在牠出生後的第三個月裡,又能開始生一對小兔,假定在不發生死亡的情況下,由一對出生的小兔開始,50個月後會有多少對兔子?

2011-04-01 12:27:00 983

转载 关于robot 限制协议

在百度google输入我的名字,很多不该出现的都出现了,^_^。强烈建议相关的站点管理员好好学学robot 限制协议。以下内容转自:http://hi.baidu.com/ligang1017/blog/item/55d58bb79949e0f330add12e.html限制robot访问web站点的方法   robot是帮助搜索引擎搜集网页的一种自动化程序,它在访问一个web站点时,会跟随网页中的链接提取出站点上的大部分内容,并为这些网页建立索引,放在搜索引擎的数据库中。在一些情况下,web管理员或网页的

2011-03-31 16:28:00 2391 1

原创 算法学习笔记(2)

作者:Rockics(http://blog.csdn.net/Rockics )转载请注明出处主要讲了各种渐进符号O,Ω,Θ,o,小的Ω,后两者较为严格。求解递归式:1:代数替换         需要预先猜测答案的基本样子。2:递归树方法         不太严谨,但是很好用。不需要展开整个递归树,观察,寻求规律。3:主方法         主方法基于一个定理,只能用在特定的递归式子上。         需要记忆三种情况。         适用住方法的时候,要注意验证使用条件是否满足。

2011-03-31 10:43:00 639

原创 代码调试记录

1.linux下c编程有时会遇到 :1.c:4: 错误:程序中有游离的 ‘/357’解决办法1.程序中输入的字符: , ; " ' / 等符号,有可能是使用的中文输入发输入的2.程序中有使用全角拼音的现象 

2011-03-30 23:04:00 951

原创 算法学习笔记(1)

一些学习前的准备:首先,在windows底下编写代码,我推荐使用RJ TextEd,很不错的编辑器。Mark一下。没有安装VC,它太庞大了,试了试cygwin,安装实在太慢,放弃了。转而使用MinGW,以前使用过,印象很不错。简单记录一下过程:1:下载http://www.mingw.org/2:安装3:相关配置。建立一个bat文件,如下:(参考 k1988的程序生活 之 MinGW介绍与使用):@set path=C:/mingw/bin;%PATH%;@echo ---**欢迎使用MinGW(GCC

2011-03-30 15:52:00 823

原创 如何运行APUE中的代码?

APUE中的代码不是download下来就可以直接编译执行的。由于头文件的问题,需要做相关的设置,修改一下相关的文件。首先从http://www.apuebook.com/src.tar.gz下载源码压缩包,解压到相应目录,例如:mkdir /home/Rockics/srccd /home/Rockics/src/wget http://www.apuebook.com/src.tar.gztar zxvf src.tar.gz解压以后得到文件夹apue.2e。按照以下步骤完成设置,则可以编译相关代码:1

2011-03-28 09:33:00 1006 1

原创 fedora 快速安装星际译王和mplayer

由于原来硬盘坏了,笔记本新换了硬盘,今天有时间装上了fedora 14.过程很顺利。由于看文献的需要,需要安装星际译王: 这个命令就OK :yum  install stardict源码编译的话需要解决好些依赖,麻烦。还是yum方便,使用工具不应该为工具所累。有一些视频需要看的,linux下播放器首推mplayer了。yum安装最简单了,以前使用fedora 8 的时候,使用过rpm包安装,一个一个的依赖,麻烦。但是,fedora 14是没有mplayer的源的,需要先加上(安装),路径如下:1:http:

2011-03-24 17:41:00 1126 1

原创 LAMP系列文章之二:源码级别研究Apache?

要展开这个话题,我想首先需要解决好为什么需要这样做的问题。源码级别看待Apache,首先需要解决态度问题哈。追溯Apache的历史,从Tin Berners-Lee1991年编写的CERN HTTP服务器算起,已经有20多年历史了。当下,Apache可以说是最流行Web服务器。facebook,google,百度等大型互联网公司所使用的web  server属于定制过的Apache,广义上也算是Apache吧,这样看的话,互联网流量的绝大部分都是由Apache服务器提供。PHP方面,虽然现有后起之秀ng

2011-03-21 22:24:00 777

原创 LAMP系列文章之:泛泛而谈LAMP(一)

09年末入创业型小公司,技术岗位摸爬滚打一年多,10年末有幸加盟大型互联网公司,在解决了终身大事之后,闲来之时有意总结工作中所思所想,于是有了这一系列文章,技术不精,文笔粗糙,贻笑大方了。本文是系列文章中的第一篇,主题在于LAMP架构中的L组件。为避免歧义,本系列文章中的LAMP是指Linux+Apache+MySQL+PHP。LAMP、JAVA/J2EE、.NET是当前web架构的三足鼎立。LAMP架构相比于JAVA/J2EE,其有轻量,快速部署等明显优点;跟.NET相比,其具有跨平台,高性能低价格等优点

2011-03-19 18:13:00 1283 1

原创 Centos 5.3 安装配置JIRA,Confluence手记

<br /> <br />JIRA是一款专业的bug跟踪与项目管理软件(Issues Tracking)。由于公司管理需要,需要在开发服务器上安装配置JIRA。Confluence据说有点类似于wikipedia,官网上的解释是:“Confluence is an enterprise wiki that makes it easy for your team to collaborate and share knowledge.”。我最近也只是安装配置,并没有慢慢品味这两者给我们带来的便利,所以软件好用与

2011-03-19 03:21:00 3937

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除