- 博客(173)
- 资源 (10)
- 问答 (1)
- 收藏
- 关注
原创 java中PriorityQueue优先级队列使用方法
优先级队列是不同于先进先出队列的另一种队列。每次从队列中取出的是具有最高优先权的元素。 PriorityQueue是从JDK1.5开始提供的新的数据结构接口。 如果不提供Comparator的话,优先队列中元素默认按自然顺序排列,也就是数字默认是小的在队列头,字符串则按字典序排列。 由于网上的资料大多将优先级队列各个方法属性,很少有实例讲解的,为方便大家以后使用,我就写
2012-03-08 21:12:18 102406 5
原创 数组中逆序对统计方法
首先阐述一下逆序对的概念。假设有一个数组为Array[0..n] 其中有元素a[i],a[j].如果 当ia[j],那么我们就称(a[i],a[j])为一个逆序对。 那么统计一个数组中的逆序对,有什么作用呢。逆序对可以反映插入排序的效率问题,如果逆序对数量多,那么插入排序的效率就低,反之亦然。 那么如何快速的找到逆序对的数量,同时又能够对数组进行排序,并且使得复杂度为O(n*l
2012-03-03 19:04:28 4611
原创 这段时间的收获
好些日子没有发博客了。前面一段时间研究各种网络爬虫,想设计出一个更高效主题定时爬虫程序,想法只停留在在初期的简易爬虫上面,虽然实现了对网页的多线程下载,但是爬取策略以及一些关于主题爬虫算法都还没有实现。自己也是冥思苦想了好久,一直没有想到更好的解决方法。就这样我的爬虫学习计划不了了之了。后面又开始研究了分词系统什么Ik啦,庖丁啦,mmseg4j,smartanalyzer等有关分词的东西,又从网上
2012-02-14 20:29:49 977
转载 毕业后五年拉开差距的原因在哪里?
毕业后,有人工作,有人继续上学。。。看了这篇文章真的让我受益匪浅,给人很大启迪,所以推荐给各位朋友来学习,希望它能帮到正在迷茫中的你,如 果你看完之后又一种“相见恨晚”的感觉,特别激动,希望你能好好珍惜这篇文章,想想多年以后 ,再来看这篇文章,一定有不同的感觉。。。正如“打工皇帝”唐骏说:我觉得有两种人不要跟别人争利益和价值回报。第一种人就是刚刚进入企业的人,头5年千万不要说你能不能多给我一点
2012-02-11 22:38:59 866
原创 基于dyse同学的网络爬虫模型的学习和实现(一)
网络爬虫的原理,简单的来说,就是通过http,socket连接来获得指定URL对应的 网页内容。显然单存的下载网页是不够的,要不爬虫怎么能够持续的获得更多的网页呢~实现网络爬虫肯定需要在已下载的网页中提取其中的超级链接,即该网页的出链。爬虫得到这些超级链接继续进行网页内容的下载,但是这就会遇到一个问题,爬虫可能重复爬取已经爬过的网站。那么这就需要进行URL的分类,一类访问过得队列,一类未访问过得队
2012-02-05 23:50:32 2347
原创 java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)的一种解决方法
昨天晚上就为了连个数据库,搞到2点都没有连上,一直出现这个问题java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)网上网友的解决方法页各有千秋记忆里大概有3种吧,一种认为是要修改root的密码,一种认为是远程连接的权限被限制了,一种是通过写一个文件在Dos里面运行
2012-02-05 11:42:09 123100 12
原创 基于Lucene3.5.0如何从TokenStream获得Token
通过学习Lucene3.5.0的doc文档,对不同release版本 lucene版本的API改动做分析。最后找到了有价值的改动信息。LUCENE-2302: Deprecated TermAttribute and replaced by a new CharTermAttribute. The change is backwards compatible, so mixed new/old
2012-02-01 17:36:57 12728 4
转载 [转自yangziqiao1988] 在MyEclipse8.5中构建Heritrix1.14.4 (真的这个确实配好了)
这里用的版本是Heritrix 1.14.4(2010年5月10日的版本 目前是最新版本) 1.首先从http://sourceforge.net中搜索下载 : heritrix-1.14.4.zip 和 heritrix-1.14.4-src.zip ,分别对 heritrix-1.14.4.zip 和heritrix-1.14.4-src.zip 进行解压 2.在MyEclipse 中
2012-01-29 20:24:16 1151
原创 lucene使用IKAnalyzer3.2.5中文分词器进行索引的一个小例子
本文通过一个小例子方便大家学习IKAnalyzer3.2.5和lucene的索引功能。以下是需要的准备环境 需要两个jar包。分别是lucene 3.5.0.jar和IKAnalyzer3.2.5两个包代码如下:import java.io.File;import java.io.IOException;import org.apache.lucene.analysis
2012-01-29 14:17:32 6709 4
原创 Fedora8 安装VMware Tools全过程图解
1.启动Fedora8,以root用户登录,VMWare菜单”VM”–”Install VMWare Tools”,会弹出窗口,里面有两个文件,一个是rpm包,一个是tar.gz压缩包,然后copy到tmp目录,解压(tar -zvxf xxxxx.tar.gz),进入目录,看到如下图所示.2.进入终端通过命令行切换到vmware-install.pl所在的目录内,通过./vmwar
2012-01-29 11:19:16 1774
原创 基于hash表的文件字符串替换
最近一直在研究百度之星的题目。刚好碰到初赛第三题,查阅了网上各牛人的解题方法,感觉收获颇多,对其中的hash的方法自己也有所理解,因此顺着自己的思路,也完成了基于hash表的该题的解法。与大家一同分享第三题(共四题 100 分):字符串替换( 30 分) 题目描述:请编写程序,根据指定的对应关系,把一个文本中的字符串替换成另外的字符串。 输入数据:程序读入已被命名为 text.txt
2012-01-03 18:54:24 917
原创 2005年百度之星初赛第一题分析与解答
躺在床上的日子里,一直就觉得需要锻炼下编程能力,意外的想到了百度之星,这个偏向算法的编程比赛。我想分析和解答该比赛的历年试题,自己在算法和编程方面应该会有大幅提升。我也就不罗嗦了,开始第一题。第一题(共四题 100 分):连续正整数( 10 分) 题目描述:一个正整数有可能可以被表示为 n(n>=2) 个连续正整数之和,如: 15=1+2+3+4+5 1
2012-01-02 17:59:22 2395
原创 2012年第一帖--新的起点新的希望
今天是2012年的第一天,这也是我在csdn上写的第一个博客。很早就打算写点东西,可是每次打开电脑总想着去玩,不想花时间写。现在躺在床上养伤的我,不能再去公司实习,更不能在实验室做项目,只能看看书,看看csdn,博客园这些技术网站,来弥补自己与别人拉下的巨大差距。 当我躺床上的时候,心理真的很难受,不知道该怎么办,以后要找工作,而且刚开始的研究生生活,就这样要躺床上静养,不能去做项目,
2012-01-01 19:42:56 1033
Java Concurrency in Practice.mobi
2017-09-20
Java Concurrency in Practice(Java并发编程实战)
2017-09-20
大数据处理算法课件
2012-06-25
任意位整数相加
2012-06-01
基于lex的shell简单实现
2012-05-31
A*解决8数码问题Java版
2012-05-05
Flex4.5做的3D网页效果展示墙
2012-03-13
大数据相关技术很多,怎么选择合适的学习方向?
2016-06-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人