2007年10月21日
网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!
1.Nutch 初体验
很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。
nutch是一个完整的搜索引擎,但是它只是一个搜索引擎他可以订制的东西太少!例如加中文分词好像要改动源文件,这样做对以后的升级维护都是麻烦。
阅读全文>
发表于 @ 2007年10月21日 09:51:00|评论(loading...)|编辑
2007年10月14日
平时总是在桌面上新建一个.txt文件来及一些琐碎的东西!每次都用Notepad。今天发现了一个有趣的应用。
那就是在文本的第一行写下“.LOG”,Notepad就会把它当作日志文件,每次打开的时候都会新建一行然后插入当前日期。
阅读全文>
发表于 @ 2007年10月14日 00:19:00|评论(loading...)|编辑
2007年09月24日
其实,这跟在跟在windows里设置没什么区别,在windows里面,我们运行startup.cmd,在ubuntu里面,我们运行startup.sh。就这么简单。下面,我说一下具体的步骤:
安装jdk
阅读全文>
发表于 @ 2007年09月24日 17:56:00|评论(loading...)|编辑
看了自己动手做搜索引擎那本书,上面写的运行heritrix的方法挺麻烦的!后来发现bin文件夹里面本来就有一个heritrix.cmd的文件,我想着一定就是windows下的运行文件,运行了一下,提示输入用户名密码!查了一些资料原来是默认的配置文件有问题,将 %HERITRIX_HOME%\heritrix-1.12.1.jar 解压到临时目录,拷贝其中的profiles目录到 %HERITRIX_HOME%\conf\目录下。阅读全文>
发表于 @ 2007年09月24日 00:36:00|评论(loading...)|编辑
2007年09月16日
Eclipse作为一个开放的IDE有很多优秀的插件,用一个好的插件可以大大的提高我们的工作效率,插件的安装方法大体有以下几种:把插件文件直接覆盖到eclipse目录里是最直接也是最愚蠢的一种方法!使用link文件,就是把插件存放到任一的地方(例如/eclipse/MyPuls),然后。阅读全文>
发表于 @ 2007年09月16日 17:16:00|评论(loading...)|编辑
2007年06月13日
网上有很多类似“百度狗” 的元搜索引擎,他们抓取百度和google的搜索结果,然后合并在一个网页里。
且不说这样做有什么意义,但是这的确是一件好玩的事,自己想了一下原理,写了这样一个类,可以抓取百度里的搜索结果。
原理很简单:
通过搜索关键和页码字进入百度,例如“http://www.baidu.com/s?wd=搜索关键字&pn=页码(这里的页码计算公式是:10*(页码-1))
找到真正有用的那一行,把信息读出来,
按照每一个项的特点把他们切开,例如URL前面都有“class=f”……
然后存起来
下面是代码:
阅读全文>
发表于 @ 2007年06月13日 12:42:00|评论(loading...)|编辑
2007年05月06日
这里写的方法都是在 http://forum.ubuntu.org.cn 里面搜到的方法!安装传说中的livecd真不是吹得,光盘就像是 “深山红叶” 可以自动启动一个操作系统,但是神奇的是他还能在这个操 作系统里把自己安装了。安装方法其实真的是特别简单,只要记住选择手动分区,然后分两个区,一个是swap格式的,大小是512,如果是1G内存,那就设置成1G的。阅读全文>
发表于 @ 2007年05月06日 17:18:00|评论(loading...)|编辑
2007年05月05日
ubuntu6.10 edgy已经发布许久了,edgy已经把xorg升级到了7.1,已经带有AIGLX了,对于安装compiz或者是Brtyl提供了极大的方便。其次 edgy把i686和K7/K8的核心整合在Generic一起了(据说有可能支持32/64位混合环境运算),nvidia-kernel- common是restricted模块的依赖(如果删除会导致一些硬件功能无法使用)。
NVIDIA 1.0-9631正式版驱动已经发布,增加了对于 GLX_EXT_texture_from_pixmap 的支持,可以直接使用Beryl了。
而且Beryl已经进入了亚洲官方和CN99的源,现在的版本是0.1.5。
很可惜,Legacy驱动还是7184版本的,看来想用Beryl,老式显卡只能用XGL了。 阅读全文>
发表于 @ 2007年05月05日 17:12:00|评论(loading...)|编辑
在ubuntu下基本上只要apt-get 就可以了,但是有时候要尝鲜就得去另外下了,这时就要了解一些linux下安软件的知识了,所以在网上找了这篇文章
摘自:CnXHacker.Net
在Windows下安装软件时,只需用鼠标双击软件的安装程序,或者用Zip等解压缩软件解压缩即可安装。在Linux下安装软件对初学者来说,难度高于Windows下软件安装。下面我就详细讲解Linux下如何安装软件。 阅读全文>
发表于 @ 2007年05月05日 17:04:00|评论(loading...)|编辑
最简单的破解星空极速的方法
本人 在江西地区,其他地方不知道是不是也可以。
原版http://forum.ubuntu.org.cn/weblog_entry.php?e=1579&sid=0d7a5844b9ff9e4786ffe93f267b4c9c(红色地方有改动)
现看看具体的步骤吧
一:Windows XP 下的工作
1.安装星空极速2.5版本,记住版本好为2.5.0016V4(不要升级,升级以后就不好用了): 阅读全文>
发表于 @ 2007年05月05日 17:00:00|评论(loading...)|编辑
1.下载9631驱动,地址是
http://us.download.nvidia.com/XFree86/Linux-x86/1.0-9631/NVIDIA-Linux-x86-1.0-9631-pkg1.run
注:现在最新的驱动为9755,下载地址为:
http://us.download.nvidia.com/XFree86/Linux-x86/1.0-9755/NVIDIA-Linux-x86-1.0-9755-pkg1.run
安装方法同下。
2.删除原驱动(也就是原来我装上去却没有起作用的glx包)
sudo apt-get --purge remove nvidia-glx
3.恢复X设置
sudo cp /etc/X11/xorg.conf.backup /etc/X11/xorg.conf 阅读全文>
发表于 @ 2007年05月05日 11:10:00|评论(loading...)|编辑
2007年05月03日
封装了标准的java输入机制,隐藏了异常的管理!
读取基本类性值时可以获取和处理可能出现的异常,如果出现异常则返回一个缺省值,便于防止异常的传播! 使用它的目的就是给简单程序一个更简单的做法
阅读全文>
发表于 @ 2007年05月03日 10:36:00|评论(loading...)|编辑
2006年08月07日
ibm的电脑用指纹做密码验证的,科幻片里有用视网膜验证的,今天我发现了一个用长相验证的东西!
阅读全文>
发表于 @ 2006年08月07日 10:23:00|评论(loading...)|编辑