自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Zvane技术Blog

upgrading......

  • 博客(48)
  • 收藏
  • 关注

原创 [原]基于体裁的中文网页自动分类的研究与实现

版权说明:本论文为原创性文章,已经公开发表在 中国科技论文在线 (http://www.paper.edu.cn)。未经许可不可剽窃、抄袭、转载,违者责任自负。引用者请注明出处如下: 赵文, 唐建雄. 基于体裁的中文网页自动分类的研究与实现[EB/OL]. 中国科技论文在线(http://www.paper.edu.cn), 2008,4.论文下载地址:http://www.paper.e

2008-04-09 11:14:00 2096

原创 [原]基于统计的中文网页正文抽取的研究

版权说明:本论文为原创性文章,已经公开发表在《电脑知识与技术》2008年01期。未经许可不可剽窃、抄袭、转载,违者责任自负。引用者请注明出处如下: 赵文, 唐建雄, 高庆锋. 基于统计的中文网页正文抽取的研究[J]. 电脑知识与技术, 2008,Vol.1,No.1,P.120-123.  论文部分:基于统计的中文网页正文抽取的研究赵 文1 ,唐建雄2,高庆

2008-03-21 00:16:00 14909 23

转载 [转]超强日期正则表达式效验

一个特牛的日期时间判断正则表达式

2011-01-05 08:57:00 1764

原创 [原]Java MVC框架性能比较

现在各种MVC框架很多,各框架的优缺点网络上也有很多的参考文章,但介绍各框架性能方面差别的文章却不多,本人在项目开发中,感觉到采用了struts2框架的项目访问速度,明显不如原来采用了struts1框架的项目快,带着这些疑惑,我对各类MVC框架的做了一个简单的性能分析比较,其结果应该说是基本符合预期的,可供大家参考。

2010-12-30 08:59:00 1939

转载 Hibernate的JNDI绑定分析

Hibernate的JNDI绑定分析 作者Blog:http://blog.csdn.net/legendinfo/    Hibernate的JNDI名称绑定是在net.sf.hibernate.impl.SessionFactoryObjectFactory程序里面实现的,我来分析一下Hibernate的绑定JNDI的过程:我们获得SessionFactory一般是这样写代码:Conf

2008-04-19 17:00:00 1733

转载 [转]Tomcat: Connector中HTTP与AJP区别

Tomcat: HTTP与AJP区别Tomcat服务器通过Connector连接器组件与客户程序建立连接,Connector组件负责接收客户的请求,以及把Tomcat服务器的响应结果发送给客户。默认情况下,Tomcat在server.xml中配置了两种连接器: Connector on port 8080 -->                   maxThreads="150"      

2008-04-02 21:58:00 8950 2

转载 [转]Java Web 框架的“甜点”

Jave Web Framework Sweet Spots Java Web 框架的“甜点” 这是一篇很有趣的文档,所以摘要一下,其实类似阅读笔记,好像是3/25发布的: 不知怎么翻译Sweet Spots,难道翻译为甜处、甜头、蜜点、蜜穴? 这时基于对以下人的采访:JSF  Jacob HookomRIFE  Geert BevinSeam  Gavin KingSpring MV

2008-03-27 00:19:00 2066

转载 [转]批处理详细教程

前言最近对于批处理技术的探讨比较热,也有不少好的批处理程序发布,但是如果没有一定的相关知识恐怕不容易看懂和理解这些批处理文件,也就更谈不上自己动手编写了,古语云:“授人以鱼,不如授人以渔。”因为网上好像并没有一个比较完整的教材,所以抽一点时间写了这片 >给新手朋友们.也献给所有为实现网络的自由与共享而努力的朋友们.批处理文件是无格式的文本文件,它包含一条或多条命令。它的文件扩展名为 .bat

2008-03-27 00:16:00 5437

转载 查全率和查准率

查全率和查准率 一、查全率和查准率是目前衡量检索效果的相对合理的指标   查全率=(检索出的相关信息量/系统中的相关信息总量)*100%   查准率=(检索出的相关信息量/检索出的信息总量)*100%   前者是衡量检索系统和检索者检出相关信息的能力,后者是衡量检索系统和检索者拒绝非相关信息的能力。两者合起来,即表示检索效率。 二、查全率和查准率都有局限性   查全率的局限性主要表现在:它是检

2007-04-15 22:26:00 8281 1

转载 什么是垂直搜索?

什么是垂直搜索?[原创]http://www.fullsearcher.com/中文全文检索网 2006-1-3 14:14:31 sigz 关键词:垂直搜索引擎 垂直搜索  原创文章,无版权,可以任意转载,但是转载必须完整转载全文、url和内部解释性链接。     垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的

2007-03-28 22:12:00 2561

转载 如何做好一个垂直搜索引擎

如何做好一个垂直搜索引擎http://FullSearch.Com 中文全文检索网 2006-3-3 8:00:41 sigz 关键词:垂直搜索技术 垂直搜索 垂直搜索引擎  原创文章,无版权,可以任意转载,但是转载必须完整转载全文、本文url和内部解释性链接。随笔、欢迎批评指正。本文先引用几句话:1.“确解用户之意,切返用户之需。”2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。”3

2007-03-28 22:08:00 2543

转载 ubuntu软件源和几个小问题

基础问题    不要老抱怨Linux这个不好,那个不方便。当你在Linux下遇到问题时,由于详细的错误提示,开源的系统代码,使得绝大部分问题的解决成为可能。而 Windows又如何呢?新手遇到怪异的毛病同样束手无策的时候,面对官方套话般的解释不明所以,由于对核心了解的专家的稀少,无法在网上、客服处获得必要的帮助,最后只有一个简单的处理办法--重装,这时你学到了什么,当频繁发生同样问题时又怎么办?

2007-03-18 09:56:00 2497

转载 Linux下Makefile的automake生成全攻略

Linux下Makefile的automake生成全攻略        作为Linux下的程序开发人员,大家一定都遇到过Makefile,用make命令来编译自己写的程序确实是很方便。一般情况下,大家都是手工写一个简单Makefile,如果要想写出一个符合自由软件惯例的Makefile就不那么容易了。   在本文中,将给大家介绍如何使用autoconf和automake两个工具来帮助我们自动地

2007-03-18 09:28:00 1664

转载 Linux程序应用开发环境和工具经验谈

Linux程序应用开发环境和工具经验谈    本文以轻松的笔调介绍了自己在Linux环境下进行程序开发的体会和经验,主要是对Linux下的开发工具和开发环境做了一个生动、明快的描述。    linux开发环境之最:    最有用开发语言: C/C++,Perl,Pascal.    最流行的工具集: gtk/gdk,qt,xforms    最好的可视化开发工具: glade,designer

2007-03-18 09:20:00 1974

转载 Linux与Windows利用ext3共享数据

Linux与Windows利用ext3共享数据这里讨论的方法主要解决以下问题: 1、通常只能以fat区共享数据(NTFS写不安全) 2、但在Linux下访问fat区,不能有全为大写的文件名,导致程序开发时需要的诸如AUTHORS、README、NEWS等文件变成不规范的小写形式,更严重的是CVS目录变成了cvs! 3、但在Linux下访问fat区,无法建立符号链,导致程序开发时autoconf

2007-03-18 09:13:00 3030

转载 跟我一起写Makefile

[精华] 跟我一起写 Makefilehttp://www.chinaunix.net 作者:gunguymadman 发表于:2006-11-17 18:19:22概述——什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和 professional的程序员,makefile还是要懂。这就好像现在有这么多

2007-03-17 22:23:00 2169

转载 gcc和g++的区别

gcc和g++的区别  我们在编译c/c++代码的时候,有人用gcc,有人用g++,于是各种说法都来了,譬如c代码用gcc,而c++代码用g++,或者说编译用gcc,链接用g++,一时也不知哪个说法正确,如果再遇上个extern "C",分歧就更多了,这里我想作个了结,毕竟知识的目的是令人更清醒,而不是更糊涂。 误区一:gcc只能编译c代码,g++只能编译c++代码两者都可以,但是请注意:1.后缀

2007-03-17 22:13:00 1968

转载 scanf()函数的用法和实践

scanf()函数的用法和实践daizh摘要:本文阐述了基于ANSI,Win 95,Win NT上的 C/C++语言中scanf()函数的用法,以及在实际使用中常见错误及对策。关键词:scanf() 一、             序言在CSDN论坛的C/C++版块,我时常见到“对于scanf()函数的用法、及出现的各种错误而迷惑”的帖子,萌发了我写这篇文章的念头。文

2007-03-16 17:06:00 2612

原创 解决Ubuntu启动时出现的 Failed to initialize HAL 错误

今天对Ubuntu搞了一些服务优化后,重启,突然发现启动时,弹出 Failed to initialize HAL错误。真晕。我都还没用2天呢,就出问题了。 难道是中病毒了? Linux没这么脆弱吧,我又不想学老一套重装系统。去Ubuntu论坛,有人说重装HAL相关软件包试一试,于是立刻启动"新立得"重装HAL相关软件包,重启后还是不行。照样弹出错误。后来发现设备管理器也打不开。电源管理也有问题。

2006-11-27 21:04:00 6333

原创 喜欢上了Linux

上个星期安装了Linux的FC4版本,学了几天,发现实在不是很好用,特别是字体问题,看得发虚。不过,我已经找到解决办法。这两天在网上查Linux相关资料,无意中发现一个介绍各种Linux版本的网站。建议Linux爱好者都来看看。http://www.beautifullinux.com/index.html浏览一番后,我惊讶的发现自己真落伍了,原来Linux有这么多漂亮的版本。好多比FC4

2006-11-25 23:26:00 2122 2

转载 第三代搜索引擎技术与P2P

第三代搜索引擎技术与P2P   第二代搜索引擎虽然比第一代在搜索速度、针对多种语言信息的扩展等方面有所改进,在以自然语言为查询语言方面也做了一些探索。然而,随着Internet的强势发展,网上庞大的数字化信息和人们获取所需信息能力之间的矛盾日益突出。IDC在2001年下半年公布的一份报告表明,前期被大肆宣传为“使用简便易用,搜索结果丰富”的搜索引擎技术正在被信息更集中的局域网取代,因为大多数搜

2006-11-23 22:14:00 982

转载 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用2006年4月17日 上午 08:01:00uT("time114523190259377514");发表者:吴军,Google 研究员前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决,让我不由

2006-11-20 16:58:00 758

转载 六度分隔与最短路径

【最短路径】圆明园的北部有一个迷宫,据说古时候每次有庆典在圆明园的时候,皇帝会派一些宫女走迷宫,看谁最先走到迷宫内的亭子,会有不错的奖赏。迷宫问题对数学家们来讲虽然是小儿科但在计算机课程上却非常重要,因为不同的求解会涉及到递归,广度优先和深度优先等算法。迷宫毕竟是一个放置在2维空间的有限联系的网络,也就是说,迷宫里的每一个点,最多只和周围的4个点(上下左右)发生关系,而且这些点的位置是

2006-11-20 16:31:00 1046

转载 相关度计算与信噪比

你知道google和百度两个关键词的相关度是多少么?--最后我将来回答这个问题通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上分析一篇文章的关键词,更重要的是它隐含的扩展的意义。传统的关于计算文本相关度和【网页和查询的相关性】的计算都是采用匹配的方式进行的,然而这只能是基于字面意义上的统计计算。这里介绍的

2006-11-20 16:23:00 1310

转载 数学之美 系列二 -- 谈谈中文分词

数学之美 系列二 -- 谈谈中文分词uT("time114462952509335533");发表者: 吴军, Google 研究员 谈谈中文分词----- 统计语言模型在中文处理中的一个应用上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀到美国与太空总署官员开会。” 分成一串

2006-11-20 16:13:00 656

转载 数学之美 系列一 -- 统计语言模型

数学之美 系列一 -- 统计语言模型uT("time114399197227125143");从本周开始,我们将定期刊登 Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。发表者: 吴军, Google 研究员 前言也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且

2006-11-20 15:53:00 670

转载 数学之美 系列七 -- 信息论在信息处理中的应用

数学之美 系列七 -- 信息论在信息处理中的应用发表者:吴军, Google 研究员 我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者会很自然地想到,既然语言模型能减少语音识别和机器翻译的错误,那么就拿一个语音识别系统或者机器翻译软件来试试,好的语言模

2006-11-20 15:41:00 601

转载 数学之美 系列九 -- 如何确定网页和查询的相关性

数学之美 系列九 -- 如何确定网页和查询的相关性2006年6月27日 上午 09:53:00uT("time115137628966847870");发表者:吴军,Google 研究员 [我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该

2006-11-20 15:27:00 640

转载 Java中容易搞错的一些东西

作者:robertb9527  出处:CSDN  1)instanceof:实现了某接口的类的对象也是该接口的实例;某类的对象也是该类超类的实例。   2)native()修饰的方法没有方法体,用一个分号";"代替大括号。   3)main不是关键字。   4)System.exit(int value),也就是说,只要是int的,就能够使JVM退出System.exit(a)

2006-11-18 18:54:00 580

转载 字符集编码研究

作者: pegasus8271. 概述本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编

2006-11-18 18:39:00 655

转载 Java程序编码规范

发布者:李小敏     所有的程序开发手册都包含了各种规则。一些习惯自由程序人员可能对这些规则很不适应,但是在多个开发人员共同写作的情况下,这些规则是必需的。

2006-11-18 18:35:00 579

原创 动态的改变IFrame的高度

动态的改变IFrame的高度,实现IFrame自动伸展,父页面也自动神缩原理: 在IFrame子页面一加载的时候,调用父IFrame对象,改变其高度具体实现:1、在IFrame的具体页面(就是子页面),添加JavaScript/*** 自动调整IFrame的高度* @ author Dekn* @ 2005-11-28*/function IFrameResize(){ //alert

2006-11-18 18:28:00 910

转载 大道至简-Java之23种模式一点就通

 一、创建型模式 FACTORY?人才市场:以往是要哪个人才,就找哪个人才,效率低,现在有了人才市场,我们只需直接去人才市场挑一个好了; BUILDER?生产流水线:以前是手工业作坊式的人工单个单个的生产零件然后一步一步组装做,好比有了工业革命,现在都由生产流水线代替了。如要造丰田汽车,先制定汽车的构造如由车胎、方向盘、发动机组成。再以此构造标准生产丰田汽车的车胎、方向盘、发动机。然后进行组装。最

2006-11-18 18:25:00 538

原创 最近的计划

        上个星期刚刚把一个初级spider程序写完,运行了一下,还不错, 不到几分钟数据库中就有了一些网站,呵呵。真挺好玩的。不过,还有待改进。最近还要帮人做一个化妆品的网站,真是晕死。不过首页已经快做好了。我的研究项目又都要耽搁下来。感觉真挺累。身体越来越不行了。以后一定要注意身体。唉。        老婆明天就来我这了,可以和她小聚一下了。真想她呀~!wa,hahaha。。。好了,不说

2006-11-12 01:39:00 663

转载 77种javascript特效全功略

发现一个JavaScript实例大全的好地方,挺不错的。嵌入HTML!瞬间拥有专业级主页——77种javascript特效全功略http://wwwb.pconline.com.cn/pcedu/zhengwen/aotong/javascript/index.htm

2006-11-12 01:31:00 684

转载 JDBC连接数据库经验集萃

JDBC连接数据库经验集萃 Java数据库连接(JDBC)由一组用 Java 编程语言编写的类和接口组成。JDBC 为工具/数据库开发人员提供了一个标准的 API,使他们能够用纯Java API 来编写数据库应用程序。然而各个开发商的接口并不完全相同,所以开发环境的变化会带来一定的配置变化。本文主要集合了不同数据库的连接方式。一、连接各种数据库方式速查表    下面罗列了各种数据库使用JD

2006-11-10 18:53:00 727

转载 搜索引擎----一场技术的博弈

搜索引擎----一场技术的博弈 日期:2005-08-09] 来源:中国电子报 作者:孙永杰  第二代搜索引擎面临挑战   提到搜索引擎,人们会马上想到Google,从技术角度讲,Google是第二代搜索引擎的典型代表。从Google诞生至今已有六年多时间,Internet上先后诞生了数千个提供检索服务的站点,著名的有Google、Dogpile、百度等。虽然这些站点的搜索引擎在收录的范围

2006-11-10 17:24:00 664

转载 学习Java的笔记

    1、由封装对象转换为基本数据类型:obj.XXXValue();obj为封装类的对象,XXX为该封装对象所表示的基本数据类型。    2、由字符串转换为基本数据类型:obj.parseXXX(String str);obj是封装类的对象,XXX为该封装对象所表示的基本数据类型。    3、由字符串转换为封装对象:obj.valueOf(String str)    4、由封装对

2006-11-10 11:12:00 764

转载 全面详解Java基础知识

1、面向对象的特征有哪些方面   1.抽象:  抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面。抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用部分细节。抽象包括两个方面,一是过程抽象,二是数据抽象。  2.继承:  继承是一种联结类的层次模型,并且允许和鼓励类的重用,它提供了一种明确表述共性的方法。对象的一个新类可以从现有的类中派生,这个过

2006-11-10 11:10:00 705

转载 Java代码编写的30条建议

(1) 类名首字母应该大写。字段、方法以及对象(句柄)的首字母应小写。对于所有标识符,其中包含的所有单词都应紧靠在一起,而且大写中间单词的首字母。例如: ThisIsAClassName thisIsMethodOrFieldName 若在定义中出现了常数初始化字符,则大写static final基本类型标识符中的所有字母。这样便可标志出它们属于编译期的常数。 Java包(Package)属于一种

2006-11-10 10:59:00 689

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除