排序:
默认
按更新时间
按访问量

网页文本的排重算法介绍

转自:http://blog.csdn.net/marising/article/details/5886431 1.信息指纹算法 判断重复网页的思想:为每个网页计算出一组信息指纹(Fingerprint),若两个网页有一定数量相同的信息指纹,则认为这两个网页的内容重叠...

2012-04-06 10:19:13

阅读数:3026

评论数:0

Weka中使用LibSVM

Weka为3.6.6版本  1、下载http://www.cs.iastate.edu/~yasser/wlsvm/上的wlsvm.zip文件 2、 解压wlsvm.zip文件,将libsvm.jar和wlsvm.jar文件放到weka的安装目录下 3、修改runweka.ini文件中的cm...

2011-12-14 17:00:51

阅读数:1723

评论数:0

马无夜草不肥:程序员做业余项目的重要性

原文地址:http://news.csdn.net/a/20111128/308194.html 编程是一种创造过程,业余项目允许程序员在没有截止日期或各种限制的条件下,以探索形式编程。业余项目之所以重要,有以下几个原因。 探索新技术 每天都会不断有新技术出现,而业余项目则是...

2011-12-01 21:43:34

阅读数:1040

评论数:0

HTML 开源Java解析器

HTMLParser HTML Agility Pack jsoup NekoHTML JTidy HtmlCleaner cobra 解析和生成器 CyberNeko jScraper Jericho MozillaParser xhtmlrenderer 解析HTML和C...

2011-11-27 16:36:09

阅读数:835

评论数:0

linux 建立两台机器的信任关系

两台机器建立信任关系,从A机器拷贝东西到B,不需要录入访问密码 1、A机器生成SSH密匙 ssh-keygen -t rsa    Generating public/private rsa key pair.    Enter file in which to save the key (...

2011-11-22 15:42:00

阅读数:867

评论数:0

IT人如何找到自己的时间?

原文地址:http://zhichang.umiwi.com/2011/1117/48806.shtml 不知道你是不是有和我一样的体会,作为IT人员(软件开发、网络运营、项目管理等等),仿佛我们每天都有做不完的事,写代码、做维护、以及我们最讨厌的,无休止的会议。 但是,除了工作,...

2011-11-17 18:47:46

阅读数:300

评论数:0

C++虚函数表解析

C++中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法。比如:模板技术,R

2011-08-24 17:47:35

阅读数:296

评论数:0

nm命令中符号类型详解

原文地址:http://www.yanyufly.com/2011/03/21/nm%E5%91%BD%E4%BB%A4%E4%B8%AD%E7%AC%A6%E5%8F%B7%E7%B1%BB%E5%9E%8B%E8%AF%A6%E8%A7%A3/ nm命令介绍的很多,但大

2011-08-24 14:08:34

阅读数:392

评论数:0

C语言函数入栈顺序与可变参数函数

下面先摘录一些: ================================================ C/C++函数调用约定与函数名称修饰规则探讨 使用C/C++语言开发软件的程序员经常碰到这样的问题:有时候是程序编译没有 问题,但是链接的时候总是报告函数不存

2011-08-22 19:57:53

阅读数:354

评论数:0

用gcc编译静态库,动态库

用gcc编译静态库,动态库(zt) 假设当前目录下有这些源文件:[main.c    func.c    func.h],其中main.c要调用func.c中的函数。 【1】生成静态库: $ gcc -c func.c -o func.o $ ar rcs lib

2011-08-22 14:06:57

阅读数:268

评论数:0

extern及extern “C”用法

原文出处:http://blogold.chinaunix.net/u/29619/showart_230148.html extern是C/C++语言中表明函数和全局变量作用范围(可见性)的关键字创意产品网 . 它告诉编译器,其声明的函数和变量可以在本模块或其它模块

2011-08-19 16:13:35

阅读数:284

评论数:0

每个程序员都必须遵守的编程原则

原文地址:http://www.etcshell.com/news-view-1150.html 好的编程原则跟好的系统设计原则和技术实施原则有着密切的联系。下面的这些编程原则在过去的这些年里让我成为了一名优秀的程序员,我相信,这些原则对任何一个开发人员来说,都能让

2011-08-19 09:23:30

阅读数:275

评论数:0

让vim认识更多的编码

原文出处:http://www.cnblogs.com/soli/archive/2008/03/17/1109931.html 如果当前locale为utf-8,则用vim打开一个gb2312编码的文件,会显示为乱码。用gedit打开却正常显示,难道vim还不如ged

2011-08-17 09:53:12

阅读数:306

评论数:0

Rsync命令详解

原文出处:http://www.cublog.cn/u/22459/showart_2049134.html 在对rsync服务器配置结束以后,下一步就需要在客户端发出rsync命令来实现将服务器端的文件备份到客户端来。rsync是一个功能非常强大的工具,其命令也有很多功能

2011-08-15 13:17:28

阅读数:384

评论数:0

如何高效产生m个n范围内的不重复随机数(m<=n)

原文出处:http://blog.sina.com.cn/s/blog_57de62c00100ltak.html 如何产生不重复的随机数?最容易想到的方法,是逐个产生这些随机数,每产生一个,都跟前面的随机 数比较,如果重复,就重新产生。这是个很笨的方法,且比较次数呈

2011-08-10 12:52:24

阅读数:2219

评论数:0

Linux下svn的使用

1、基本命令 (1)查找帮助  svn help 查看的帮助svn help import,在这里有详细的import命令的用法。 (2)svn import 将一个工程加入到svn中,eg svn import  testproject   [

2011-08-08 19:27:47

阅读数:380

评论数:0

C语言的inline

转载地址:http://tech.e800.com.cn/articles/2009/1130/1259561065460_1.html      本文介绍了GCC和C99标准中inline使用上的不同之处。inline属性在使用的时候,要注意以下两点:   1.      in

2011-07-29 10:22:41

阅读数:376

评论数:0

C++中的容器类详解

原文出处:http://www.cublog.cn/u3/94667/showart_2302116.htmlC++中的容器类包括“顺序存储结构”和“关联存储结构”,前者包括vector,list,deque等;后者包括set,map,multiset,multimap等。若需要

2011-07-09 16:15:19

阅读数:2241

评论数:0

《深入学习:GNU C++ for Linux 编程技术》 第23章:使用标准模板库(STL)

STL概述        STL的一个重要特点是数据结构和算法的分离。尽管这是个简单的概念,但这种分离确实使得STL变得非常通用。例如,由于STL的sort()函数是完全通用的,你可以用它来操作几乎任何数据集合,包括链表,容器和数组。        STL另一个重要特性是它不面向

2011-07-08 21:31:54

阅读数:1245

评论数:0

C++ 局部类和嵌套类

局部类  在一个函数体内定义的类称为局部类。局部类中只能使用它的外围作用域中的对象和函数进行联系,因为外围作用域中的变量与该局部类的对象无关。在定义局部类时需要注意:局部类中不能说明静态成员函数,并且所有成员函数都必须定义在类体内。在实践中,局部类是很少使用的。下面是一个局部类的

2011-07-08 14:18:41

阅读数:365

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭