- 博客(17)
- 资源 (5)
- 收藏
- 关注
转载 Awstats 安装使用说明
Awstats 安装使用说明转自:http://freemantc.cnblogs.com/archive/2005/11/14/276086.html 简介AWStats是一个基于Perl的WEB日志分析工具。 AWStats的运行模式1、统计分析日志:将结果保存在一个txt文件中,最新版本支持xml数据格式。2、输出分析结果:利用cgi程序输出,或生成静态htm
2007-10-31 18:42:00 880
转载 搜索巨鳄迈克·林奇来华斡旋 Autonomy中国布局加速
7月24日凌晨,现年40岁的英国Autonomy全球CEO迈克·林奇( Mike Lynch )和公司COO安迪·康特(Andy katner)一行从英国飞抵北京国际机场。自2003年Autonomy进入中国市场以来,这还是迈克·林奇第二次来华——此前的一次是去年3月,当时由他亲自操刀,Autonomy首次在国内互联网搜索市场进行了前期部署。尽管Autonomy大中华区首席代表伍昕对迈克
2007-10-28 10:17:00 1198
转载 发现搜索的价值:走出语义搜索的误区
第三代搜索,作为对以Google为代表的第二代搜索范式的超越或者说革新,时下正逼近一个重要的时间拐点。这股范式转型潮流由多条支流组成,其中一个支 流是包含本地化搜索、社区内容搜索、知识问答社区等在内的社会化搜索,另一个支流则是人工智能、模式识别、语义分析、神经网络等智能搜索。 可以说,就技术门槛而言,智能搜索代表了下一代搜索的主流趋势。但鉴于基于神经网络、人工智能的搜索耗资巨大,目前还处
2007-10-28 10:03:00 1101
原创 org.apache.nutch.indexer之IndexingFilter
该类是一个接口类,所有的插件都要继承这个类,这个类也是indexing的扩展点。
2007-10-26 19:55:00 894
原创 nutch源代码分析--index(一)
package org.apache.nutch.indexer;1。static OutputFormat类用来初始化lucene对象并设置lucene各个参数。各个参数从JobConf job参数中获取。2. public void reduce(WritableComparable key, Iterator values, OutputCollector output, Reporter
2007-10-26 15:46:00 1334
原创 nutch0.7.2安装成功
1、设置Nutch的环境变量 在Windows系统的环境变量设置中,增加NUTCH_JAVA_HOME变量,并将其值设为JDK的安装目录。比如笔者电脑中JDK安装于D:/j2sdk1.4.2_09,因此将NUTCH_JAVA_HOME的值设为D:/j2sdk1.4.2_09。 2、Nutch抓取网站页面前的准备工作 (1)在Nutch的安装目录中建立一个名为url.txt的文本文
2007-10-23 16:08:00 993
原创 打war
一、可用命令e: /work/webRoot>jar cvf stockchart.war ./"./"表示webRoot下的所有文件打成war 包.jar 主要是打jar包放在jboss下需要 war包在war 包下不可直接用 winrar打開後,覆蓋裡面的文件,可能winrar是把文件壓縮,而非打成war包所有用winrar後,更改jboss下的war包,沒有反應。二、可用eclips
2007-10-21 19:54:00 611
原创 java中获得当前路径的方法
import java.io.File;public class LocalPath { /** * 得到文件的当前路径 * @param args */ public static String GetCurrentPath() { return System.getProperty("user.dir","."); } pu
2007-10-21 18:00:00 1136
原创 ARtool Project (FP-tree)
http://www.cs.umb.edu/~laur/ARtool/ ARtool Project Overview:ARtool represents a collection of algorithms and tools for the mining of association rules in binary databases. ARtool is a
2007-10-17 20:47:00 1623
原创 apriori算法思想
(1)L1 = find_frequent_1_itemset(D);(2) for(k=2;Lk-1≠∮,k++){(3) Ck = apriori-gen(Lk-1);(4) for each t∈D {[5) Ct = subset(Ck,t);(6) for each c∈Ct c.count++;(7) }(8) Lk = {c∈Ck|c.count>min_support};(9)}
2007-10-17 20:02:00 3136
原创 web程序的初始化问题——ServletContextListener - []
应用ServletContextListener接口,可以实现在web应用程序初始化时,自动运行一些初始化程序。ServletContextListener接口定义的方法 方法名称 调用时机
2007-10-17 11:28:00 901
原创 在linux下配置JAVA环境
1.下载安装JDK 。 2.修改bashrc vi .bashrc set JAVA_HOME=/usr/java/jdk5.0 export JAVA_HOME set PATH=$PATH:$JAVA_HOME/bin export PATH set CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export
2007-10-15 14:06:00 620
转载 倒排算法实现
转自http://blog.iyi.cn/rimen/2006/01/倒排索引技术主要应用与全文检索,通过对非主关键字的分析,建立内容与PK之间的关键。通过索引文件 存储后提供给应用高效的检索。 如果需要自己定制倒排索引器,算法应该实现如下的步骤:1.信息分析,对输入的数据项或者记录(P,K)中的K做一个过滤的词法和语法分析。 主要对数据中非主关键字内容K进行分词,过滤,分析等获得一
2007-10-13 10:44:00 2656
原创 最大正向匹配算法
package fenci;import java.io.BufferedReader;import java.io.FileInputStream;import java.io.InputStreamReader;import java.util.*;public class ReadFileToVector { /** * @param str * @author:
2007-10-13 08:58:00 3071
原创 Tell the Java VM to Load the DLL
Tell the Java VM to Load the DLL There are two different ways to load a native library into a running Java program: System.loadLibrary(String) and System.load(String). The System.load
2007-10-13 08:51:00 763
原创 readline()
readLine() - 类 java.io.DataInputStream 中的方法 已过时。 该方法无法将字节正确转换为字符。从 JDK 1.1 开始,读取文本行的首选方法是使用 BufferedReader.readLine() 方法。对于使用 DataInputStream 类读取文本行的程序,可以转而使用 BufferedReader 类,实现方式是通过将以下形式的代码:
2007-10-11 18:41:00 871
programming.collective.intelligence.aug.2007.pd
2009-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人