<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>thebigforest的专栏</title><link>http://blog.csdn.net/thebigforest/</link><description>热爱生活，热爱自然！ </description><dc:language>zh-CN</dc:language><lastUpdateTime>Sun, 21 Oct 2007 09:50:50 GMT</lastUpdateTime><ttl>60</ttl><item><dc:creator>thebigforest</dc:creator><title>Nutch使用汇总</title><link>http://blog.csdn.net/thebigforest/archive/2007/10/21/1835336.aspx</link><pubDate>Sun, 21 Oct 2007 09:51:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/10/21/1835336.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1835336.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/10/21/1835336.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1835336.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1835336</trackback:ping><description>网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!

1.Nutch 初体验
很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。
nutch是一个完整的搜索引擎，但是它只是一个搜索引擎他可以订制的东西太少！例如加中文分词好像要改动源文件，这样做对以后的升级维护都是麻烦。
&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1835336.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>Notepad的妙用</title><link>http://blog.csdn.net/thebigforest/archive/2007/10/14/1823712.aspx</link><pubDate>Sun, 14 Oct 2007 00:19:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/10/14/1823712.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1823712.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/10/14/1823712.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1823712.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1823712</trackback:ping><description>平时总是在桌面上新建一个.txt文件来及一些琐碎的东西！每次都用Notepad。今天发现了一个有趣的应用。

那就是在文本的第一行写下“.LOG”，Notepad就会把它当作日志文件，每次打开的时候都会新建一行然后插入当前日期。
&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1823712.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>ubuntu运行tomcat</title><link>http://blog.csdn.net/thebigforest/archive/2007/09/24/1798870.aspx</link><pubDate>Mon, 24 Sep 2007 17:56:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/09/24/1798870.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1798870.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/09/24/1798870.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1798870.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1798870</trackback:ping><description>其实，这跟在跟在windows里设置没什么区别，在windows里面，我们运行startup.cmd，在ubuntu里面，我们运行startup.sh。就这么简单。下面，我说一下具体的步骤：
安装jdk
&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1798870.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>运行heritrix成功！</title><link>http://blog.csdn.net/thebigforest/archive/2007/09/24/1797732.aspx</link><pubDate>Mon, 24 Sep 2007 00:36:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/09/24/1797732.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1797732.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/09/24/1797732.aspx#Feedback</comments><slash:comments>2</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1797732.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1797732</trackback:ping><description>看了自己动手做搜索引擎那本书，上面写的运行heritrix的方法挺麻烦的！后来发现bin文件夹里面本来就有一个heritrix.cmd的文件，我想着一定就是windows下的运行文件，运行了一下，提示输入用户名密码！查了一些资料原来是默认的配置文件有问题，将 %HERITRIX_HOME%\heritrix-1.12.1.jar 解压到临时目录，拷贝其中的profiles目录到 %HERITRIX_HOME%\conf\目录下。&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1797732.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>Eclipse插件安装的3种方法</title><link>http://blog.csdn.net/thebigforest/archive/2007/09/16/1787303.aspx</link><pubDate>Sun, 16 Sep 2007 17:16:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/09/16/1787303.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1787303.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/09/16/1787303.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1787303.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1787303</trackback:ping><description>Eclipse作为一个开放的IDE有很多优秀的插件，用一个好的插件可以大大的提高我们的工作效率，插件的安装方法大体有以下几种：把插件文件直接覆盖到eclipse目录里是最直接也是最愚蠢的一种方法！使用link文件，就是把插件存放到任一的地方（例如/eclipse/MyPuls）,然后。&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1787303.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>抓取百度搜索结果——解密百度狗</title><link>http://blog.csdn.net/thebigforest/archive/2007/06/13/1650307.aspx</link><pubDate>Wed, 13 Jun 2007 12:42:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/06/13/1650307.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1650307.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/06/13/1650307.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1650307.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1650307</trackback:ping><description>网上有很多类似“百度狗” 的元搜索引擎，他们抓取百度和google的搜索结果，然后合并在一个网页里。

且不说这样做有什么意义，但是这的确是一件好玩的事，自己想了一下原理，写了这样一个类，可以抓取百度里的搜索结果。

原理很简单：

通过搜索关键和页码字进入百度，例如“http://www.baidu.com/s?wd=搜索关键字&amp;pn=页码（这里的页码计算公式是：10*（页码-1）） 
找到真正有用的那一行，把信息读出来， 
按照每一个项的特点把他们切开，例如URL前面都有“class=f”…… 
然后存起来 
下面是代码：
&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1650307.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>shell入门 3</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601192.aspx</link><pubDate>Tue, 08 May 2007 23:11:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601192.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1601192.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601192.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1601192.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1601192</trackback:ping><description>　　l .bash_history ：记录了您以前输入的命令，

　　l .bash_logout ：当您退出 shell 时，要执行的命令，

　　l .bash_profile ：当您登入 shell 时，要执行的命令，

　　l .bashrc ：每次打开新的 shell 时，要执行的命令。
&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1601192.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>shell入门2</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601189.aspx</link><pubDate>Tue, 08 May 2007 23:08:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601189.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1601189.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601189.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1601189.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1601189</trackback:ping><description>l ll ：将执行‘ls -l -k‘（以长格式列出目录内容，包括一些文件属性，并以 KB 而不是 byte 为单位显示文件大小）l ls ：将执行‘ls -F --color=auto‘（列出目录内容，加上文件类型标识，并使用颜色）第三篇：命令的排列／命令的任务调度／命令的替换。将先在屏幕上列出目录中的所有内容，然后列出所有目录及其子目录所占磁盘大小。&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1601189.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>shell入门 1</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601186.aspx</link><pubDate>Tue, 08 May 2007 23:06:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601186.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1601186.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/08/1601186.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1601186.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1601186</trackback:ping><description>这些机器的操作系统由汇编语言、机器语言写成，所以运行起来效率很高，但都无法移植(unportable)。每家计算机公司都给自己的机器配上独有的操作系统，然后再销售。（Thompson 曾经参加了一个项目：MULTICS，Unix 是与这有关的一个玩笑词）其实，Dennis Ritchie 为这个新的操作系统设计了一种新的编程语言-- C 语言后，事情才真正开始。虽然 Unix 的效率不及原来的操作系统，但有三个突出的优点：可以任意移植到其他机器，其中的 C 语言大大简化了编程，而且这些都 free 。很快，全美国的大学都忙着开始为机器安装 Unix 。&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1601186.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>Linux  初学者笔记</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598240.aspx</link><pubDate>Sun, 06 May 2007 17:18:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598240.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1598240.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598240.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1598240.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1598240</trackback:ping><description>这里写的方法都是在 http://forum.ubuntu.org.cn 里面搜到的方法！安装传说中的livecd真不是吹得，光盘就像是 “深山红叶” 可以自动启动一个操作系统，但是神奇的是他还能在这个操 作系统里把自己安装了。安装方法其实真的是特别简单,只要记住选择手动分区，然后分两个区，一个是swap格式的，大小是512，如果是1G内存，那就设置成1G的。&lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1598240.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>Ubuntu 安装实录</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598037.aspx</link><pubDate>Sun, 06 May 2007 12:41:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598037.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1598037.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/06/1598037.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1598037.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1598037</trackback:ping><description>sudo pppoeconf

然后按照提示一步一步操作即可。
注意它会提示你是不是开机自动连接上网，选择是，每次开机就会自动拨号。

二、修改为国内源

我这里使用 cn99 的源比较快，使用哪个根据自己实际情况决定。
我这里只列出了使用得比较多的 lupaworld 源（http://mirror.lupaworld.com/）和 cn99 源（http://ubuntu.cn99.com/）。 &lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1598037.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>ubuntu 显卡＋桌面的安装方法</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597255.aspx</link><pubDate>Sat, 05 May 2007 17:12:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597255.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1597255.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597255.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1597255.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1597255</trackback:ping><description>ubuntu6.10 edgy已经发布许久了，edgy已经把xorg升级到了7.1，已经带有AIGLX了，对于安装compiz或者是Brtyl提供了极大的方便。其次 edgy把i686和K7/K8的核心整合在Generic一起了（据说有可能支持32/64位混合环境运算），nvidia-kernel- common是restricted模块的依赖（如果删除会导致一些硬件功能无法使用）。

NVIDIA 1.0-9631正式版驱动已经发布，增加了对于 GLX_EXT_texture_from_pixmap 的支持，可以直接使用Beryl了。
而且Beryl已经进入了亚洲官方和CN99的源，现在的版本是0.1.5。
很可惜，Legacy驱动还是7184版本的，看来想用Beryl，老式显卡只能用XGL了。 &lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1597255.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>在 Ubuntu linux下安装软件</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597250.aspx</link><pubDate>Sat, 05 May 2007 17:04:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597250.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1597250.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597250.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1597250.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1597250</trackback:ping><description>在ubuntu下基本上只要apt-get 就可以了，但是有时候要尝鲜就得去另外下了，这时就要了解一些linux下安软件的知识了，所以在网上找了这篇文章
摘自：CnXHacker.Net
在Windows下安装软件时，只需用鼠标双击软件的安装程序，或者用Zip等解压缩软件解压缩即可安装。在Linux下安装软件对初学者来说，难度高于Windows下软件安装。下面我就详细讲解Linux下如何安装软件。 &lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1597250.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>ubuntu下星空急速最简单的方法</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597247.aspx</link><pubDate>Sat, 05 May 2007 17:00:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597247.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1597247.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/05/1597247.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1597247.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1597247</trackback:ping><description>最简单的破解星空极速的方法
本人 在江西地区,其他地方不知道是不是也可以。

原版http://forum.ubuntu.org.cn/weblog_entry.php?e=1579&amp;sid=0d7a5844b9ff9e4786ffe93f267b4c9c（红色地方有改动）

现看看具体的步骤吧

一：Windows XP 下的工作

1.安装星空极速2.5版本，记住版本好为2.5.0016V4（不要升级，升级以后就不好用了）： &lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1597247.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>thebigforest</dc:creator><title>7.04手动安装Nvidia显卡驱动</title><link>http://blog.csdn.net/thebigforest/archive/2007/05/05/1596896.aspx</link><pubDate>Sat, 05 May 2007 11:10:00 GMT</pubDate><guid>http://blog.csdn.net/thebigforest/archive/2007/05/05/1596896.aspx</guid><wfw:comment>http://blog.csdn.net/thebigforest/comments/1596896.aspx</wfw:comment><comments>http://blog.csdn.net/thebigforest/archive/2007/05/05/1596896.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/thebigforest/comments/commentRss/1596896.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=1596896</trackback:ping><description>1.下载9631驱动，地址是
http://us.download.nvidia.com/XFree86/Linux-x86/1.0-9631/NVIDIA-Linux-x86-1.0-9631-pkg1.run

注：现在最新的驱动为9755,下载地址为：
http://us.download.nvidia.com/XFree86/Linux-x86/1.0-9755/NVIDIA-Linux-x86-1.0-9755-pkg1.run
安装方法同下。
2.删除原驱动（也就是原来我装上去却没有起作用的glx包）
sudo apt-get --purge remove nvidia-glx

3.恢复X设置
sudo cp /etc/X11/xorg.conf.backup /etc/X11/xorg.conf &lt;img src ="http://blog.csdn.net/thebigforest/aggbug/1596896.aspx" width = "1" height = "1" /&gt;</description></item></channel></rss>